2007/08/28

分散 Loading....

把資料庫轉移到第二台機器後, 現在已經不會有資料庫連不上的狀況了, 因此這幾天嘗試著加大網站的負荷, 但發現只靠一台來當 web server 是不夠的, 因此把 java/images 的子目錄的一些動作移到另一台機器....

因此若是您的貼紙是用 img src=http://look.urs.tw/images/xxxxx.php?BlogID=xxx 者, 可以改成 http://images.look.urs.tw/xxxxx.php?BlogID=xxx , 此時就不會因為 Loading 過高造成速度較慢, ...

事實上我們還開了 java.look.urs.tw 來做 Load Balancing, 雖然可能會是用 DNS Round Robin 的方式來做 SLB, 但對於 javascript 嫌慢的人也可以做這樣的調整, ....

在這翻調整過後, 事實上發現錯估設備的須求, 事實上真的要保持一定的成長, 似乎是兩台還不夠的, 說不定要 3 ~ 4 台才行, 因為現在 2 台要達到 100% 的效能, 已經是 70% 的滿載了, 在這種狀況, 夠資源的觀點是要增加機器才行...

2007/08/26

第 11111 個貼紙....

只是不小心看到這數字, 蠻有趣的, 就剪下來...
看一下是那個部落格, 是 ♡。鼠。來。鼠。去。♡

2007/08/25

第二十一次藍眼觀注投票結果

這一次投票有 133 人投下 209 票, 共 4433 分, 最後結果如下:

35 票 680 分 True Colours
64 票 628 分 讀書人 's 靜心居 & 高爾夫人

以上為前兩位高票的人, 接著是:

14 票 425 分 工頭的家
8 票 323 分 阿祥攴網路筆記本 ::
15 票 286 分 看‧小小小
9 票 269 分 毓毓的窩
6 票 189 分 中時部落格-詹怡宜的部落格
4 票 164 分 愛麗絲の鑰
7 票 159 分 Ken Park -
7 票 148 分 啾啾的部落格

這幾位分數都很高, 但離前兩名還是有段距離, 所以只取兩名, 所以最後恭喜 True Color 的 Sharon 以及讀書人這兩位...

系統進入穩定狀態....

這次系統, 從一台變成兩台, 把資料庫跟網頁分開, 結果有趣的是結果 Loading 明顯的下降, 如此可以知道是超過可負荷時所造成 conetent switch 吃掉大部份的資源...

如此一來, 部落格觀察目前機器說不定可以負擔不只兩倍以上的負荷, 但這個可能還要詳細計算, 只是最主要還是要把程式慢慢的改成可以很輕易的分散式處理, 雖然即使很多功能目前是不只 5 台在同時計算的...

因此在解決掉點閱數的遺失後, 會將介面做一個大改變, 希望到時對新使用者不會有過大的入門障礙, 但也在此提出若是有興趣幫忙規劃自己想要的介面的人, 請提供意見或甚至就一起來參與, 讓這系統可用性更高, ...

畢竟這個計劃是一個以使用者導向的系統, 且非營利, 因此是希望是屬於大家的開放式系統.

2007/08/24

資料庫轉移

在新增機器後, 第一步就是把資料庫獨立出來到新的機器, ....

因此在今天 4:40 ~ 5:00 做資料庫轉移....
過程雖然出現不少意外, 但很快就解決, 所以 20 分鐘完成轉移...

但在 10:00 時, 意外發生了, 因為 server 與資料庫流量過大, 反而防火牆把之間的連結檔掉, 而之前忘了寫白名單, 所以到 12:00 時這段時間是掛掉的狀態...

只是這段時間貼紙影響不大, 畢竟這連結斷掉之後, 回應只是在瞬間而已, 因此只有網站的運作失常, 貼紙數字出不來, 但沒有造成 Lag 是不幸的大幸...

這資料庫轉移一拖就是快兩個月, 真不好意思.. 此時貼紙的 Expire 也同時取消, 回復正常..

2007/08/22

Door.urs.tw 到部觀門的歷史

2006/06/12 第一次提出 Door 計劃
2006/07~08 嘗試寫作 Door
2006/09/20 部落格觀察開始, 確定 Door 延後
2006/11/20 定出 12 項 W2O 計劃
2007/03/27 開始搜集 Referral 資料
2007/05/19 搬移新機器
2007/06/05 提出第一篇關鍵字分析
2007/07/03 提出 Semantic Web 計劃
2007/07/24 Door Open! 開始有 Keyword 貼紙
2007/08/02 公開關鍵字林
2007/08/14 解決速度的問題
2007/08/20 正式開始 Door 計劃
2007/08/21 訂名為 "部關門"

原本 Door 是一個 "經過統整" 的 Referral 計劃, 而到最後是 "經過統整" 的關鍵字計劃, 而這計劃的最困難點, 是如何 "統整" 出有用的資訊...

所以從開始資料搜集到最後公布, 足足花了 5 個月的時間, 事實上在 4 個月時, 還認為這是一個較為長遠的計劃, 但在 7/18 確認從 Google 的資料來判別關係度是有問題時, 本來以為一定要走類 Semantic Web 的架構....

很意外的在 7 月 20 日用一個簡單的方法整併出有用的資料後, 這計劃從 2~3 個月的測試期變成一個幾乎可以立刻上線的系統, 但這之間也在忙許多事之後, 才在 8/20 把外框完成, 貼上貼紙上線....

原本是叫 "絡門", 但後來改成 "關觀門", 而最後是定名為 "部觀門", 這個當然是 "部落格觀察之門" 的縮寫, 但也是取 "不關門" 的諧音, 更希望的在一些介面的完成後, 能夠有自己的完整流程脫離 "部落格觀察"...

當然這是一個很強的工具, 未來也會有衍伸出其他相關的計劃, 但這些都等做出來再說, 這篇只是在做出來的時候, 做一個歷史的小結吧...:)

2007/08/20

部落格觀察部落格獨立

很多人知道部落格觀察是 MyZilla 專案的 urs.tw 企劃的一個子計劃, 但這個案子已經大到必須獨立出去了, 因此決定成立部落格觀察的專屬部落...

因為原本的部落格有 90% 以上都是部落格觀察的資料, 因此, 反倒是先將其改名後, 另建立新的 MyZilla 官方部落格, 因此要查 MyZilla 的資料者, 請至 http://myzilla.blogspot.com/

在轉換的時間造成不便, 請再次包涵....

但通常這個動作, 表示無論是部落格觀察, 或 MyZilla 都會有大動作了..

2007/08/18

落格觀察總排行的一個補完 (近期成長)

大部份的人看到自己部落格的排名, 總是搖搖頭, 因為就目前分數的採樣, 結果發現名次永遠都是成立很久的那幾個, 因為大部份的分數都是累積性的, 自然時間久的累積就會多....

網路勾結與抽樣調查的差別 說到,

用這種 Sliding Windows 的算法是避免單一筆資料的錯誤或變化過大, 在某種觀點是種展開到後面四個星期, 也因此能夠有穩定性與即時性的雙重特質, 這在時間序列的計算很常見,也是一種移動平均的概念.

因此在 網路勾結 採用這種 Sliding Windows 的計算方式, 來去確保活躍度的即時性及穩定性, 而部落格觀察卻一直沒採用, 因此在這邊做了一個這樣的補完...

所以有個 部落格活躍度排行榜 來取代總排行, 因為這才是更能承現即時性的排名, 而不是永遠停留在前面無法超越的狀況, ...

目前是以 8 週作為一個區間, 但因為是階差, 事實上是有參考到 9 週的資料, 而將這數字經過一個權重加總起來, 以後說不定會以這名次做為最主要的排名也說不定...



2007/08/17

試行 "重視度" 指數化

為了避免有些人刻意操作部落格排名, 因此將重視度做指數化的動作, 這個效果會讓單一的社群網站若有過高的分數, 不會影響其他的社群的存在重要性...

因此試行將所有網摘與訂閱數取對數後, 加總, 而為了保持分數沒有過高的差距, 因此取平方, 這次試行到星期六晚上, 若沒有太大的問題就會採用此方式, 不然會回歸原本模式...

[後記]
這樣的效果, 讓當時經營單一或少數社群書籤網站的部落客, 原本有較高的名次, 而被拉下去, 相反的原本沒在經營社群的部落格, 更能夠呈現部落格在各個社群的原始價值....

2007/08/15

最新 BSP 分佈圖

因為這兩個月的 Loading 都很重, 都不趕去算最新的 BSP 分佈表,
但剛好今天比較晚睡, 也在跟朋友聊到這件事, 所以就算了一下...

詳細資料在 http://bbs.blog.tw/viewtopic.php?pid=5984 這邊有...
而最新的試算表在 http://myurl.tw/006l 這邊...

從最新的前 1000 名變化來看,
1. 主要是 Xuite 與 Blogspot 在爭第三名, 目前還未分出勝負
2. Pixnet 擠掉東森, 變成第 9 名
3. exblog 跳到 17 名
4. imtv 勉強進排行榜
5. MSN/Live 掉出 20 名榜外...

除外

1. backpacker 在 2000 名中, 已有 3 人, 不會比 mw, url 來得少了
2. 在 2000 名中, 反而 Blogspot 遠勝於 Xuite, 甚至 roodo 還追上第4 名

還有那些 BSP 有在成長我們沒算到呢?
請提供寶貴意見..

2007/08/14

Furl 網摘前 30 名

排名 Blog 名稱 Bloglines Furl
1/149(126) 半桶水網路觀
290 1/268
2/102(131) 三腳貓學狗叫 252 2/266
3/688(919) 活力藥師網 2 0/232
4/1643(1596) arguskao - 天空部落 0 0/231
5/1647(1581) Xuite日誌:活力藥師網 0 0/231
6/1812(1759) 活力藥師網 182 0/231
7/1161(1137) 活力藥師網-新浪部落 0 0/231
8/168(147) 活力藥師網 0 0/186
9/741(695) 活力藥師網
5 1/185
10/493(467) 活力藥師網 0 1/185
11/2383(2274) 小杜鵑的冬天 - 樂多日誌 1 0/185
12/2409(2298) 【高藥師之無病呻 0 0/185
13/4180(4086) 活力藥師網 - 0 0/167
14/466(447) PHPTW 79 0/25
15/1131(1358) 網站優化與網路行銷 77 0/24
16/1(1) 彎彎~用漫畫寫日誌 - 760 4/19
17/1049(1205) 玉里 82 0/18
18/2(2) amarylliss。艾瑪[隨處走走] 344 5/13
19/225(202) Think of Joe - 195 17/12
20/3253(3174) 璞石閣 64 0/12
21/270(253) - Kyle's Flash Blog - 138 0/11
22/11(12) AMYKAKU - 290 3/9
23/100(98) 白文咪咪與小鸚KIKI的生活記 91 7/9
24/16(26) 酪梨壽司已搬家至Pixnet 394 4/7
25/173(159) Christabelle的藝想世界 - 0 5/7
26/80(75) Sounds and Fury -
192 24/7
27/8(13) 阿修的部落格 809 52/5
28/115(110) Yealing's自拍日誌 - 2 3/5
29/291(363) h@LLs 112 0/5
30/64(58) phopicking的網路日誌 - 293 1/5


2007/08/11

第 20 次藍眼觀注得主

這次的藍眼觀注投票相當激烈, 共有 98 人投下 233 票, 共 5689 分, 結果如下:

23 票 642 分 北歐四季透明筆記
18 票 639 分 小海 Podcast 部落格
25 票 622 分 花水木 HANAMITSUKI

18 票 504 分 LVCHEN的美國生活指南
16 票 453 分 馬修的研究室 - 馬修網誌
20 票 446 分 SEO 部落格 : 網路行銷及網路賺錢
20 票 392 分 PIXNET BLOG :: 酪梨壽司的日記
6 票 244 分 沒有人要去英國
5 票 216 分 蘋果綠˙愛生活 -
15 票 213 分 『Chris's Crime』
9 票 142 分 大豆剝落殼
3 票 138 分 Something about Ken
8 票 111 分 吉米丘上的部落格

因為第 4 名與前 3 名的分數並沒有很接近, 所以只取 3 名, 因此對 LVCHEN 先說抱歉, 尤其這次投票相當擁躍, 超過 300 分以上的有 7 個部落格, 這分數與票數在大部份的投票都可以的獎, 但在這次如此激烈的情型下只能說相當可惜...

最後恭喜 shani, 小海與花水木..

2007/08/03

啟動圖型版貼紙的Expire....

因為最近 Server 的 Loading 過重, 新的機器可能要到下星期才會上線, 在不得已的情型下, 跟當時換機房時一樣的狀況, 啟動圖型版貼紙的 Expire (時效), 而時效為 2 小時, ...

會造成的影響: 使用圖型版貼紙的部落格點閱數會變成人次...
不會造成的影響:純文字 Java 版的使用者不會有影響..

希望在下星期加新機器後, 這問題會解決...

在此時, 也暫時關閉 "昨日觀注" 與 "上週觀注" 的使用....

為了讓系統能夠順利運作, 請包含這個臨時性的調整...