2006/12/31

Yahoo Link 改從國外抓取

因為台灣的 Yahoo 在上週三時, 在搜尋 Link 時,
都會失效變成去查詢網頁,
但有不少人會因為防呆的關係沒有更新,
只是有些人因為網頁的關係有大量成長或退步...

所以在成長或退步超過 10% 時,
我們把上週的資料還原成上上週的資料,
而在這週開始改抓國外的 Siteexplorer,
在星期四之前, 可能因為更新週期不一致時,
會有大量成長與退後, 但過後就會跟原本排行差不多..

若在星期三之前台灣 Yahoo Link 恢復正常,
就會開始改抓台灣資料, 不然下一週會以美國為基準...

而若要知道是怎樣下抓取的,
可以在成長歷史中看到其連結,
此時資料反而更接近 BlogInfluence 了...

2006/12/30

部落格的關係

部落格會有甚麼關係呢?

最主要是兩種, 一個是推薦或讀者,
一個是進一步成為雙向的好友...

而我們希望從這邊來了解部落格之間的關係,
因此寫了個系統讓大家互相建立關係 ..

一個是推薦部落格,
而依照一個部落格成長越大,
可以推薦的部落格也會越多....

一個是好友關係,
目前只設定為每個部落格只能與10個部落格建立好友關係,
當若雙互建立好友關係時,
應該要有一個更有趣的功能發展才對...

但有可能以後會有種 BlogRoll,
是以兩階展開的 BlogRoll 為導向,
也就是說除了可以看到你這個 Blog所推薦的 Blog,
還可以看到推薦過的 Blog 的再推薦,
而好友 Blog 也是一樣.....

只是這兩個 Widget/Badget 事後會開發,
但在之前可以大家試用,
畢竟看這樣的關係也沒有趣的,
說不定部落格也有 "Six Degree of Seperation"/"六度分離" 的狀況...

而使用方式就是在看到小小的眼睛出現在部落格旁邊,
就可以按下去之後選擇..
當然前提是要 "註冊", "登入", "認領"...
不然也只有 "加入觀察" 這個選項了..

而剛設定的資料, 會出現在首頁, ... Have Fun...

2006/12/28

有關 Yahoo Link 錯誤的問題

下午 野貓 說, 所有的 Yahoo Link 都變成 1,
除非有裝 Sitemap或 RSS...

但我發現不是 Yahoo Link 變成 1 的問題,
而是都是變成網頁內容數而非連結..

但幸而在之前有為 Yahoo 寫防呆(防錯)的保護,
所以並沒有造成問題, 但相對新加入的 Blog 就抓不到了...

因此我們會持續追蹤這問題,
若有問題的話, 可能會從其他地方來抓 Yahoo Link,
但若是國外抓也出問題的話, 可能只好忍痛去掉這項,
希望不會這樣才好...

2006/12/24

第五次藍眼觀注 -- Judysmile Experimental Blog

這次投票因為是星期三開始, 所以投到星期六,
最後的結果是:

3/12 Judysmile Experimental Blog -
4/11 馬修的研究室部落格
3/11 A closet -
3/11 用愛看世界---大愛主播倪銘均 -
3/10 PIXNET BLOG :: Nelson 的遊樂場

因為發現前10名與後面20名已經沒有絕對差別,
只有 Judysmile 獨得 12 分,
所以最後結果也是由 Judysmile 獨得...

而我們發現一個星期一次的投票太頻繁了,
從第六次開始, 改成每兩星期一次,
因此這星期將不舉辦, 改成下星期,
並且以後入圍者會變成 30 個,
投票數會增加到 5 票, 且會有 10 天的時間,
以及到時得獎的會是前 2~3 名....

2006/12/22

部落格觀察三個月雜感(愛麗絲)

既然師傅已經先寫了感言
徒弟也來寫一篇好了

部落格觀察在定義上是9/20開站
但是其原始構想早在半年前就開始發想和溝通的
不過這些發想和溝通都發生在吃飯的時候
並不是像大家所認知的在MSN上進行大部份事務
這應該也算是整個部落格觀察發展過程中惟一可以拿出來記錄的事情吧?

在整個計劃中,我在前期負責的時間較多
最近因為自己的飯碗問題,負責的時間較少
但還是部落格觀察計劃的天字第一號測試者
所有的新功能要推出之前,一定要先經過我這一關,確定OK了才會推出

另外,跟客服、公關有關的工作也是我在負責
我自己先自首,並不是一個很好的客服與公關
只能回答一些非技術性的問題
演算法和網站機制的問題,真的請各位去問我師傅,他會解釋得相當清楚
但是為什麼要挑這些指標來計算,這個就可以問我了
(因為大部份的計算指標,都是我丟給我師傅的)

在這三個月當中
我自己的部落格也加入觀察
但是都是加持別人的分數比較多,被加持的機會比較少
(流量的話也是有被加持到,前兩個月差點都破表)
不過也因為參與部落格觀察的運作
看了很多優質blog不說
在處理幾位部落客要不要被加入觀察的事件中
也得到這幾位部落客的善意諒解
這是我覺得最開心的事情了

我師傅說做部落格觀察對他而言是社會公益
對我來說,其實是讓大家都有浮上檯面的機會
如果因為部落格觀察這個計劃
讓台灣部落格圈或國內各BSP有良性的競爭(也就是所謂的既競爭又合作)
或者在各項比賽上有報名認定的依據
或者廣告主在投放廣告上有利潤切分比例的歸屬
不也是好事一件嗎?

2006/12/21

部落格觀察三個月雜感 (食夢黑貘)

部落格觀察在定義上在 9/20 號開站,
雖然嚴格說是在前一個星期的星期二晚上就開始寫程式,
但事實上是到 9 月底時, 才意識到這是一個會持續經營的服務,
甚至是比 MyZilla 更多人使用的系統...

在剛剛, 貼紙使用總數悄悄的破了 2千萬 次,
本想快照起來的, 但只照到 19999999 次,
殘念....

當然其中也發生很多事,
無論是有趣或令我煩心的,
在這三個月真的感受到蠻多事情,
做為今年的一個結尾是相當不錯的.

短暫的三個月, 結識了不少人,
但其中也有原本不熟而變熟的,
只是最重要的是這三個月大概是這三年中,
熬夜次數最多的三個月了.....

就像是現在已是 3:20 了, 雖然我剛剛是躺下了,
但又掛念的爬起來了, 所以寫下這一篇....

現在只希望至少能夠減少熬夜的時間,
雖然我知道我是作夢也會夢在做這些企劃案,
若能夠做出讓大家有在用的東西我就蠻高興了.

如同今天看到學弟 bangdoll,
他原本就是 MyZilla 的忠實用戶,
且他的 Blog 是相當不錯的,
相較之下完全只有文字而已,
不, 應該是說我到現在 Blog 齡才只有 9 個月而已.
他就在今天用了不少功能,
能夠自己用的高興, 給朋友用的愉快,
以及不認識的人也願意使用,
這就代表這系統已經算是成功了!

賺錢? 是跟本沒想到的事..
名聲? 我怎能夠預期到會這樣受歡迎?

不少人很意外, 我做這些都是為了社會工作,
就像是我雖然看到 iThome 的專訪,
"發揮玩家精神,打造部落格新應用",
我覺得怎麼看都很像專訪產生器出來的文章,
但卻寫的很平實, 真感謝黃先生,
因為距離上次專訪大概是 5 年前,
且讓我的感觸沒有那麼深,
甚至是真的感覺出, 我從別人眼中看到我自己.

"不只是捷運日記" 在部落格觀察的加持下,
雖然我知道有更多人看, 且名次從原本應該 2000 ~3000 名的,
變成到 100 名那邊, 回應率也從原本是千萬分之一的,
大概上升到萬分之一, 這是我沒想到的...

雖然我知道, 我是花在部落格觀察最多時間的人,
因為我知道我做了之後, 有很多人因此會受益,
但事實上我獲得的學習與其他東西, 也是最多的.
這句話寫出來連我自己都覺得很八股到嘔心,
可是這也是事實阿....

但最有趣的經驗是, 我是第一次經營原本陌生的網路社群,
因為我之前在玩 BBS, 到弄個人站, 那些朋友都是熟識,
而這次是不一樣, 也遇到港澳的 Blogger,
甚至領教到鄉民的擇善固執,
這樣的多樣性是我以前沒遇過的,
就像是昨天還遇到有人想用貼紙, 但又不想留資料,
這點可以說是最大的收獲, 而我在我的 Blog 也寫過了.

這段期間, 可以說是 80% 都是我在確認是否是台灣或個人的 Blog,
所以看了數千個 Blog, 是連我自己都沒料想到....
甚至看到 SANA 生病時, 我還是真的跑去留言,
雖然我不認識他, 但天天看在排行榜上,
且大部份的文章都看過, 連 SANA 是男是女, 做甚麼都不知道,
那種感覺距離並沒有那麼遙遠....

因此, 透過這系統, 能夠短暫的跟使用者交會,
或者是建立長期關係 (那是更好了),
雖然目前這 10000 個 Blog 我沒辦法都很仔細看,
但希望因為這系統把大家的 Blog 串連起來後,
大家又因為 Blog 的串連, 後又串連在一起....
若能夠如此有所滿足大家的期望, 這會是我下一波的動力....

2006/12/20

第五次藍眼觀注投票開始

因為在第四次與第五次投票交替之際,
剛好因為病痛的關係沒有記錄當時的成績,
所以只好寫程式去撈...

先恭喜上次投票的結果是:
亞典波羅的伊謝爾倫日記貓在家裏
並列...

第五次因為星期三才開始,
所以投票截止延到這星期六截止....

因為現在採取所有成長成績, 扣掉資料錯誤後留下 20 名,
所以已經沒有前 10 名與後 10 名的問題了,
因此名次已經不重要, 甚至排名也只是參考,
大家請就 "最近有顯注成長" 的 Blog 投票,
不是要投給 "表現好" 的部落格, ....
不要忘記...

2006/12/19

計數器的比較

有些人很好奇為甚麼我們的計數器為甚麼那麼少?
甚至有人懷疑是有問題的,
我們在這邊做個比較...

計數器點閱數人次
Google-Analytics730919136112
Sitemeter723517131680
LogBird439545119490
BlogLook405466n/a


很明顯的我們的計數器是 Google Analytics 一半,
但跟 Log Bird 差不多, (相差不到一成)

最主要我們做了個控制,
也就是同一個 IP 若是在 3 秒內連點兩次,
我們只計一次, 所以當使用者快速的 Reload,
或切換頁面時, 我們不計算點閱數....

因此若是用我們的計數器的話,
可以宣稱是表面上的 2 倍左右,...

就部落格而言,
通常點閱數是人次的 1.5 ~ 2.5 倍左右,
所以結果我們的數字很接近真實的人次...

而我們後來不打算有重製或基本數等等的機制,
很紮實的表現數值...

但我們將會提供其他的分析圖表,
畢竟這是我們的專業..

2006/12/18

新增 Yahoo MyWeb 的資料

運作了兩個星期後大致認定沒有問題,
而加入了 "重視度", 因為這是經過人所摘下來的書籤...

2006/12/14

目前1000大Blog的BSP分布

目前的 BSP 分佈如下...

無名: 253 (+37)
Yam: 149 (-2)
blogspot: 52 (+0)
Xuite: 50 (-9)
sina: 37 (-16)
chinatimes: 32 (-15)
webs-tv: 16 (-14)
fc2: 7 (+4)
ettoday: 6 (-2)
udn: 8 (-4)
blogs: 6 (n/a)
mypaper: 5 (+1)
iTHome: 4 (-11)
wordpress: 4 (+0)
yahoo: 4 (+3)
pixnet: 1 (+1)
PChome: 1 (n/a)
MSN+Live: 1 (n/a)

下面三個是私人邀請制的:

Oui-Blog: 11
Bluecircus: 6
Bloggerism: 6

前 300 名的分布:

無名: 63 (-1)
Yam: 39 (+3)
Blogspot: 22 (+2)
Xuite: 16 (-1)
Chinatimes: 6 (-3)
Sina: 6 (-5)
Webs-tv: 5 (+0)
fc2: 1 (+0)
msn+live: 1 (n/a)

掉出去的有: iTHome, MyPaper, Wordpress

2006/12/10

第四次藍眼觀注

在停止了兩次藍眼觀注之後,
發現這模式是有問題的,
所以因此修改程式,
先把前 60 名記到候選名單,
再把因為資料在更新出問題的不列入,
而產生出 20 名名單..

這次前 60 名不列入投票的原因有下:
1. 因為加入時間時, Bloglines 等還未更新,
因此一更新後名次大幅提升.
2. 這次雖然沒有 Bloglines 在做怪,
但換成 Technorati.
3. 而在上星期去 Technorati 登錄者,
上星期有會有突然升高的現像.

排除上面這 3 點, 就是最後的 20 名候選人,
我想經過這樣的手續, 以後應該比較減少失效的機會,
若在 60 名真的不到 20 名可以投票,
以後再從缺也比較昭公信...

最候, 請大家擁躍投票, 來對努力者獎勵,
在某方面, 無論得到前兩名與否,
分數較高的代表被更重視與認同..

2006/12/08

點閱數的說明

雖然貼紙都會提供基本的計數器,
但我們的計數器有做了一些較嚴謹的定義,

1. 同一個來源在三秒內同時讀取一個貼紙, 不會重覆計數.
因此不會因為使用者在同一頁用了三個貼紙就算三次.

2. 在 熱門菜單 等等的排行榜, 是以單日的 IP 數來排序.
而使用者數是指有在 urs.tw 登入的人.

3. 因此往往會比在他的計數器少一些些,
但若使用者真的有讀取到, 我們相信數字是一定的準確度...

4. 而所有的點閱數排行榜, 都是以有貼帖紙的人為主,
我們拿不到沒有貼貼紙的人數目..

5. 而像 roodoo, yam 要計算到每一頁, 必須在 Blog 標題用貼紙才行,
可以參考 不只是捷運日記 那樣 ..

6. 我們做了一張圖, 是這 60 天的點閱數,
而目前還沒有貼紙化, 因為類似的服務很多, 但有興趣的人可以跟我們講你的想法..

2006/12/03

這次藍眼觀注又要停止

看了一下成長的排行,
因為 MSN Live Search 加入之後,
名次改變相當大...

結果前 20 名的,
大都不是最近較大成長的,
都是因為指數的調整所造成,
所以只好繼上個星期又暫停一週,
因為即使要成立也要有意義才行...

2006/12/01

有關未來排行的改變(12/5日開始)

不少 Blogger 對於我們的建議與指教,
我們將會在 12/5 後, 實行一個新的政策,....

於 12/5 後才加入的 Blog,
在還沒認領或使用貼紙,
以及加入的前三個星期內之前,
以及加入的前三個星期內之前,
將不會顯示排行, ...
也就是要顯示排名要等三星期後,
或被認領或使用貼紙...
也就是要顯示排名要等三星期後,
或被認領或使用貼紙...


並且我們的台灣地區個人部落格排名,
只會計算到總名次 10000 名.

但相對的我們會推出一系列貼紙,
來給使用者的經營的參考,
可能會趣味性較多....

而貼紙的應用與方向,
以及這個想法的執行,
請多給我們建議, 謝謝..:)


[後記]
12/5 號以前加入的, 我們會選定個時間,
將未被認領與使用貼紙的人, 停止排行,
預定是在 12/20 號左右,
(2個星期的公告差不多對之前的人做交代了),
所以若要繼續知道排行的, 請作認領或使用貼紙,...

新的貼紙, 這次沒有排名

我相信再排名下去已經有人會翻臉了,
因此短時間內也不會再做有排名的貼紙,
所以這次是純脆自己與自己比較...

這個是較完整版的..


但有人不想看到 Eye or Ra 的話,
也有簡易版...


請大家可以拿去玩,
但最後的數值可能要過兩個月才是OK 的...
畢竟也不可能知道在用之前的數值..

程式碼在取得貼紙那邊, ....

這兩週的綠眼觀注

如同前一篇所說的, 隨著資料的新增,
綠眼觀注也隨之提高門檻,
但還是這兩週各有一個網站進到綠眼觀注,

上週是 Mr. 6 - 趨勢.創業.投資.策進,
這週是矇矇的秘密基地,

恭喜這兩位....

加入 MSN Live Serach

我們加入 MSN Live Search 的 Link 值,
因此無論是指數, 影響, 總分都會跟著更動,
唯一沒變的是重視度...

慢慢會把資料寫出來,
但已經計算在內了...

而為甚麼沒有加 Live Search 的網頁數呢?
因為發現大家不是 4 就是 8, ...
沒有計算的參考價值, 所以跟 Yahoo 一樣只留 Link 數...

2006/11/30

第四次的藍眼觀注

因為上上週在 Bloginfluence 當站情型下,
造成上週在排行前 20 名的成長,
都是原本 Bloginfluence 沒抓到的情型下所造成,
因此只好暫停一週的藍眼觀注,

而第三週的藍眼觀注最後由 Christabelle的藝想世界 獲得,
因為是在排行前 10 名, 所以只選出這位,
所以第四次的藍眼觀注順延到下週...

感謝 Muse 先生的建議...

雖然一開站時, 就有 Private Flag, 將不想列入排行的人隱形,
也開放 Blogger 在留言版, 官方部落格或 mail 給我們設定,
目前的 10264 筆資料中, 約有 10 幾位跟我們說,
我們也一律做這樣的設定,
也以為這樣應該就足夠保障大多數人對隱私的想法....

但 Muse 先生希望不只是我們的資料庫不存在任何有關他的資料,
也希望在這前提下讓別人輸入失效,
在我想不出辦法的情型下, 跟他講我們只能先刪掉,
(在這邊也請大家幫我們想, 如何在不存在任何型式的A資料下, 擋掉A的輸入)

雖然目前只有 3 個人提出完全刪除他們資料的請求,
且 Muse 先生寫的也不無道理, 因此我們將會做下面幾個調整...

1. 將會改成 robots.txt 直接設 private_flag
2. 當任何人輸入資料時, 沒有認領或貼紙使用前不會出現排名
3. 當註冊登入後, 輸入新資料, 也在三個星期後才會出現排名,
在這段期間當我們發現問題會立即隱形或刪除.

此時也保持原本的作法:
1. 任何人提出要隱形的, 可以跟我們說, 無論是 email 或留言版
2. 想要刪除資料的, 我們也一律做到, ...

之外, 我也想到一個方法:
在部落格寫入 "我想知道排名", 以及我們所發送的認證碼與連結後,
當使用者按下去才會開始排名..

雖然是只有 3 個人如此回應過,
但我們相信任何人的回應只要有道理我們就該檢討與改進,
本來就不應該以言廢人或以人廢言,
任何人或單一個人的意見都該被重視的...

只是在此跟 Muse 說聲抱歉的事,
原本這計劃只是個實驗, 並沒有經過詳細的規劃與問卷調查,
更沒有做過任何評估, 更不要說是有完整的系統分析,
而會造成這麼大的回響是出乎我的意外,
所以像 robots.txt 本來就該做而沒做,
本來就是我們的錯, 我們不應該因此脫罪, 應該道歉與補上...

而除外 Muse 先生對我個人本身的批評與建議,
因跟部落格觀察無關, 不在此回應...

2006/11/18

排名的方式

有些人說排名沒有公開計算方式,
但我想沒甚麼特別的,

就是把我們計算的現在 指數, 影響, 總分, 重視,
以及 BlogInfluence 與 Technorati 的排名,
這六項加總後排序.... (依小而大)

一點都沒有做任何改變與操作...:)
所以就我當時忘了做完整說明...

而有人說對新創的 Blog 不利,
本來部落格的影響力本來就是靠時間累績的...
但我們即將推出文章閱讀排行的專門網頁,
此時就跟經營時間無關了...

又有人認為很多參數可以操作,
我們也不否認, 但要完整操作這六個分數,
要付出的代價還比乖乖寫文章更高...

0.3 改版開始....

已經獨立新機器了,
但若您 DNS 的 IP 還是舊的話,
設定成會自動轉到 main.urs.tw,
所以大部份的功能都沒問題,
除了登入以外....

這台機器是較好的機器,
所以可以開始寫新功能了..:)
期待 0.3 beta 的推出吧...

2006/11/15

最近系統的轉換

在 11/14 下午 2:00 到 7:45 時,
因為 ADSL Router 出問題,
造成系統無法連結...

"在此對大家抱歉"

甚至在合理的完美主義觀點,
在這段時間大家把貼紙給 < ! - - 起來也是對的,
但等我們換完系統將會有 0.3 版的推出,
那時資源與速度應該不成問題...
到時大家再努力來用吧..

綠眼觀注的提高

因為最近 Yahoo 的 Link 大量增加,
所以許多人的分數也隨著大量提升..
而在這段在更新前後不一的時間點,
名次會有較大的變動,
但也解決 update 的時間週期為 3 天,
我想以後會比較穩定了...

但綠眼觀注也因為這樣的關係,
這週將不會進行確認,
而留待下週, 且會提高分數...
目前規劃是:

Index指數: 2500
Influence影響: 2500
Score總分:25000
Att重視:100

也就是前三項提高 25%,
因為重視度沒受影響...
但也可能在更新後, 發現提高 25% 不夠時,
將會提高到 50%....
若有意見的話大家可以提出...

但最重要的是趕快換機器,
目前進度是: 正在恰談 Colocation 的地點,
若有人能夠提供幫忙,
我們會很感謝....

2006/11/11

第二次藍眼投票

最後結果是
13 名 5 票 13 分 野貓的零碎生活片段
1 名 5 票 12 分 遨遊天地任我行
12 名 4 票 11 分 Mr. 6 - 趨勢.創業.投資.策進
19 名 3 票 10 分 NEKOB-log-E

這 4 個 Blog 的分數真的很接近,
但原本已經說是 1~2 名,
且頂多是第 1 名是 10 名以後的人會取一位前 10 名的人,
所以最後還是給予 wildcat 與 DearJohn 這兩位 Blogger 的 Blog 藍眼觀注...

雖然這次系統有當站一天,
投票人不多, 但我們真正不是為了要比票數,
只是認為不該都是由系統決定,
所以這週的結果還是如期結束...

2006/11/10

真是多事之秋阿.... 留言版掛了..

理論上不該寫在這邊...

首先是家裏電腦掛了,
接著是 Look.urs.tw 也掛了..
家裏的 Server 也再起不能..
然後 Notebook 電源線也斷了..
接著一堆事,
然後剛看 cbox 留言版也掛了..
這真的要公告了..
但這件事是跟我們沒有直接關係的...

在這邊徵求, 誰有不要的二手電腦,
對我們而言, 只要是電腦就可以..
跑Windows 很難跑沒關係,
因為我們是要跑的是 FreeBSD,
若能提供, 我們可以維持 3 天 update 一次..:)

2006/11/09

系統搬移與重新進行

因為系統有問題, 我們臨時在朋友地方找個地方棲身,
在轉移過程中花了近一天的時間.....
有些人因為 DNS 更新不夠快, 所以還是有人無法使用,

也是因為機器較弱, 我們把圖檔先設有 cache,
因此若是用圖顯示的使用者,
不只更新速度是 2 小時, 且不會完整計數,
等我們移到新機器後將會復元...

所以也請大家盡量使用 javascript 的文字模式會較快..

(而在改程式的時候, 有些人用的排名是空的..., 但現在已經復元)

2006/11/07

系統停機公告

因為未知原因,
流量突然過大,
所以停止服務,

可能要等到明天查明原因後才能恢復服務...

請大家見諒, 我們緊急建立一個空白頁讓原本的圖不會過慢..

出問題的時間在 12:30 到 17:40 停止服務前,
而我們將會做系統轉移等等可能...

2006/11/04

有關這次 "入圍部落格大獎"

說真的, 我是沒期望在只貼出幾篇文章的 Blog 能夠入圍,
但真正的目的是想要報名大事件想讓大家使用這系統,
因為部落格觀察本身不是對部落格"本身"的 "創新實驗",
而是對外在的 "創新實驗"...

但透過 "標簽林", "熱門文章排行" 及 "我的觀察BlogRoll" 這三個,
以及之後的計劃, 希望能對 Blogosphere 有所幫助,
這是我們的初衷....

所以若等公布決選名單, 若我們有提名大事件的話,
請大家多多投票支持...:)

第一次藍眼觀注公佈

在經過不是很激烈的投票 (我們也不期望激烈),
最後 Jas9 Taipei. 獲得 15 人投票得37 分, 確定拿到藍眼觀注,
但因為 Jas9 是10 名後, 而 MLChen’s 屁眼看時尚 是在前 10 名最高票與最高分的,
所以這次是由這兩個 Blog 獲得.

當然其他候選者也是相當值得鼓勵,
尤其是像第三高者是 台灣媳婦在西雅圖 -, 更是威脅到 ML Chen,
所以大家也請多參考其他候選者,
因為很多人在說為甚麼他名次一直沒有往前,
但這幾位就是一直名次提升的代表,
從這幾個 Blog 就可以找出原因與端倪.

最後恭喜這兩位, 我們會放在首頁一個星期以資獎勵與推薦.

2006/11/01

給香港區Blogger 的道歉文(及冰浩)

在上星期六, 我為了希望讓一些人了解一個部落格經營,
不是只有幾個月到半年就可以的情型,
在留言版寫了希望有人統計出所謂百大部落格的經營時間,

而有位 Blogger 叫冰浩,
寫了篇 "[部落世界]中文前百大部落首發文章資料篇",
也讓大家了解一些部落格經營的不容易...

但還沒在討論如何更精確的來去說 "何謂開始 Blogging " 時,
因為隨手看到 Cosine Inn 餘弦棧 不是台灣區的 Blog,
但已經放很久了, (通常90%的網站我們都會發現而先排除在排行外),
所以我就寫了一句話, (我忘了, 請大家 Digg 一下)
後來被 Stannum 看到, 引起相當的不快, 而發生一連串的事件...

他希望我們公告
"由於本站仍未推出台灣地區以外的排行榜﹐現暫時將以下非台灣背景的部落格移往其他地區的組別中﹐待該組別的服務推出時一併計算﹕"

這點我們相當認同...
也後來修改首頁加一句話:
" (整體而言是指台灣經濟圈的模糊定義)"
來去讓大家了解這問題...

基本上就系統開發人員, 是最不想去 "釐清" 問題,
比較想 "解決" 問題, 但遇到這 "問題" 我們也不得花兩天的時間暫停寫程式,
來讓大家了解我們真正的想法...

而對於 Sidekick 寫出 部落格觀察的白眼,
我個人不會引以為意,
因為我把 Blog Look 當作社會工作,
在我的心中總是 淡水+台南 > 台灣 > 華人 > 亞洲 > 地球,
所以會對非台灣的華語圈放較低的 Priority 是真的...
畢竟我做這計劃不是為了賺錢, 不然應該一開始就做華人圈...

所以也對於我的確有 "白眼" 對待, 這樣說真的是較嚴重些,
還不如說是 "大小眼", 且至少不會跟日向家族的 "白眼" 搞混... (我說到那裏了)...
但要我在短時間把別人與自己一視同仁可能在我這年紀的修養還做不到,
因此再說一次道歉....

當然最大的問題是一開始我們沒有規劃週詳所致,
但或許又換個角度看, 若規劃週詳的話,
可能這計劃還在討論中或腦海中, ........
因此也得承認這個錯誤, 雖然是合理, 但我們不能狡辯這不是錯誤...

我希望在短時間 (應該一個月內可以完成) 將這問題解決,
但只是程式面的部份, 但真正的判別可能還是要有能夠熟此 blogosphere 的人主導...
所以才貼出 "徵求香港地區工作人員"
因為雖然我是技術論者, 但我知道許多事情還是得由人, 無論是工人或眾人智慧,
才是真正的答案...

只是最後對 Stannum 抱歉一下,
我不可能列出這些網站,
因為大約有 200~300 個....
當然要去區分那些是一開始就被我們先排除,
那些是放超過一段時間才發現,
這個我想應該不太重要...

但事實上還有更大的爭議,
是 "是否要排除群體創作", 以及 "判斷類Blog的CMS",
我相信有更多的 Webmaster 或 Blogger,
應該可以體諒我們的用意....

對於 Blog Look 的發展迅速超過我的預期,
因此我肯定這不是我的功勞, 而是很多人, 包含使用者大家,
先說聲謝謝...:)

2006/10/31

徵求香港地區工作人員

看到有些人的回應,
我們認為去檢討是否是台灣這問題意義不大,
更重要的是績極開發香港, 中國(簡中), 及其他海外部份的排行發展進度...

因為最近有不少港澳的人給我們不少留言,
我們也認為時機也到了,
所以徵求香港地區工作人員 1~2 人,
最好是能夠達到 "綠眼觀注" 標準的人...

如此希望能早點完成這系統的開發,
因為許多資料庫並未考慮到這點,
所以會用較複雜的設計來完成,
時程真的很難說... (唉, 若簡單的話就會很早做了)....

但真正的問題是要了解 Blog 圈的人,
判斷是否是屬於個人創作,
因此真的須要有一個人參與這項工作,
有意願的人請在後面接續 Comment...

PS. 我已經寫封信邀請 sidekick 幫忙,
感謝她對這議題如此投入...:)

關於最近引起的一些爭議

同步回應在 只是一踢(Just a Sidekick)


先做幾點說明,關於排名方面:

首先,我們不會做「人工調整名次」的動作,
只是排名有兩種區別,加上不列入統計的 flag 後,會跟其他都不列入統計的站台一起排序,所以原本排名前一百,不過我們發現該 Blog 非台灣區後,會將它加上一個 flag (或許黑貘用字比較直觀,所以他稱之為刪除,不過其實並沒有真的被刪掉,只是另外統計),這時該 Blog 就會跟所有的站台一起做排序(包含其他暫時不列如排名的),所以名次會下滑。
所有的計算都是程式運作,所謂的人力介入只是決定這個 Blog 的屬性罷了。

再者,並非刻意要去區分非台灣地區 Blog 不能列入排名,只是世界各地網路發展情況,以及使用文化不盡相同,甚至各地搜尋引擎能找到的資訊也有所差異,例如我們現在搜尋引擎主要是使用 google.com.tw 以及 tw.yahoo 的連結數,如果拿這些數據來計算港澳、或是中國的 Blog ,勢必無法正確的顯示出這些 Blog 真正的「分數」,所以才先將之排除在外,未來或許會針對各地用當地人常用的搜尋機制來做評分,只是我們研發的進度受到人數與時間的限制,所以期間如果讓大 家有所誤會,會是引起一些爭議,還請多見諒。

再來講一下這邊草創時的一些心路歷程:

其實當初在做這對我們而言算是茶餘飯後消遣的網站時,確實也只是抱著「想知道自己的Blog,或是那些常去的Blog經營到什 麼程度了,除了透過Blog本身的Plugin,還有什麼辦法來瞭解自己的Blog與他人間的關係?如果不會程式的人,就沒辦法知道自己Blog的熱門文 章、來源、訪客等詳細資訊嗎?弄一個方便導讀的系統吧」,造成這麼多迴響是我們始料未及的。

而且排名的機制只是諸多功能中最好做,所以先放出來的,或許人性本來就是喜歡比較,大家都很熱衷於此道呢!

目前才成立一個多月,而且我跟黑貘都是工程師背景,所以所謂的文字說明、條款、規範等實非我們所擅長的,只能隨著時間慢慢將一些體制建立完整,這方面也請大家多提供建議,我們也會秉持著 2.0 的精神發展下去的。

2006/10/30

我的觀察 與 觀察輪播貼紙

花了一點時間,把這功能逐漸修到比較堪用的程度。

有註冊,登入的使用者,在搜尋結果中有個黑色的小眼睛就是將該Blog加入我的觀察。

進入我的觀察後,就可以看到已被加入的部落格清單,大致上格式跟排行榜差不多,不過有多了兩個連結,[del] 是將該部落格從觀察清單中移除,[hide] or [show] 就是決定部落格是否在輪播清單中出現。按下 [hide] 後該部落格就成為隱藏狀態,link也會顯示為 [show] ,再按一下回復顯示。

輪播貼紙是以 JavaScript 的方式,讓大家放到自己部落格的 Sidebar (or panel ...etc.) 上,可以搭配 limit = xx (xx 為數字)的方式來決定顯示的數量,我自己是把常去的 Blog 都加入我的觀察,並且輪播,也是替友站們廣告方式之一囉 :D

ps. 必須登入後才能使用以上功能

使用範例請參考 我的 或是 Gene 的 部落格。

2006/10/29

百大部落格的經營時間

星期六我在去 TOSSUC 之前,
在留言版說,
"有沒有人想施展工人智慧, 看前100名那些經營超過一年, 那些超過兩年的數目呢?"

在今天就看到 冰浩 就完成這使命,
寫出 "[部落世界]中文前百大部落首發文章資料篇",
大家可以去看看...

剛剛略數了一下, 略過沒算到的 3 個站,
經營不到一年進到排行榜的有 3 個站,
當然經營超過 2 年的, 這個還要扣掉回溯的,
數字較難掌握...

但大家可以看到經營成果與時間的觀係...
不到一年而名次最高的大概是 一個 ACG 站,
黑心人形の部屋
只是作者應該不是從這個 Blog 才開始,
是因為之前一定有相關經營的經驗的文章,
才能更這麼快有上去...

(此時發現 Cosine Inn 餘弦棧 不是屬於台灣生活圈為主的 Blog,
因此排除這個排名, 所以對此 Blogger 與冰浩先說抱歉了...)

藍眼觀注

在綠眼觀注這個是屬於長期經營的標記後,
真正想做的是對於現在有在努力的人獎勵...

當然或許我們部落格觀察是無法給與任何實值的獎勵,
只有透過輪撥等等機制去鼓勵 Blogger 的投入...

藍眼觀注是取上週排名進步的前 20 名為入圍名單,
由 Blogger 的投票來產生...
原本是想只給綠眼觀注的人來投票,
但後來還是想給予權重的差異就好...

因此定位成, 只要認領過的使用者,
綠眼關注的使用者, 每票 5 分,
Blog 指數超過 2000 分者, 每票 3 分,
Blog 指數超過 1000 分者, 每票 2 分,
Blog 指數超過 200 分者, 每票 1 分.
而只是註冊而未認領, 或認領的 Blog,
不予計分, 最主要是避免投票部隊,
但若是得票最高, 且是得分第二名者,
也會同給與藍眼觀注獎章...

而為甚麼要設這個獎項,
可以見 "不只是部落格觀察的部落格觀察",
當然第一次開始運作, 考量一定不夠週全,
請大家給予意見...

其他的規則是 :
每人可以投三票, 在截止時可以更動
此Blog上週跟他自己有進步者,
雖然列出20名, 但盡量是投給前10名,
理論上是分數最高者得,
但若第二名人數較多或分數接近,
則兩個同時並列,
每週日或星期一貼出上週榜單進行投票,
每週五晚上截止投票應揭曉...

2006/10/28

點擊記錄

這個是一直說要寫的,
既然大家幫忙放貼紙,
總要做一些資料分析,
所以就做了點閱排行.

因此若是有放貼紙的Blog,
在點擊記錄就可以看到昨天與前天的點擊記錄,
下一步是對於認領過的人,
會每天寄一份資料過去...
或許也會用 RSS 或 XML-RPC 貼到 blog 上...:)

也因為放貼紙的人越來越多..
所以把點擊的排行放大到前 300 名..

2006/10/25

標簽林的開始 (Tagswoods)

做了個標簽林的 Demo,
透過這樣的標簽林不只是只到 Blog,
而且還可以做雙向連結..

標簽內容是進入搜尋,
而後面跟著的連結數則進入最近被連進的 Blog,

大家可以參考我做的測試..
http://look.urs.tw/showtags.php?BlogID=1&type=list
也趁機開放將可輸入的 Tags 增加到 10 個...

2006/10/23

eyes 大集合!









有需要的請自行取用 :)

標簽雲 Tags Cloud

已經透過 Technorati, Delicious 與 HemiDemi 抓到 Tags 作參考,
日後看能不能加入 Google Search Key 作資料 (這可能是 door.urs.tw 的計劃),
最後想做一個 wood.urs.tw 的 標簽林 的計劃...

這可能是真的實用性的 AJAX,
因為打算隨著使用者而改變這森林,
讓大家透過這計劃漫遊部落格,
來觀察部落格..

而目前認領完之後,
可以去新增 5 個標簽, 也可以把原本抓到的標簽給隱藏,
產生新的標簽雲,
這樣 , 大家可以參考看看..
而貼紙部份應該很快就可以寫好了...
然後就是讓使用者可以自己加別人的標簽後就算完成第一部份...

目前較熱門的 Tag 有那些, 我 dump 了一個 實驗頁 給大家看看...

2006/10/20

綠眼觀注


基本上我們希望 "部落格觀察不只是部落格觀察",
但當時想要推出來的第一個觀注的是比較不錦上添花的 "成長觀注",
只是也是希望開放投票權, 所以也要定義出投票權的人,
因此就先有 "綠眼觀注" 的開始,
也就是得到綠眼觀注的人就可以參與 "成長觀注" 等等的投票..

但除了功能外, 也期望有人能夠幫忙畫個圖,
無論是 88*31 或 88*15 的圖來給這些得到這個觀注的人,
有沒有人願意幫忙阿...

註: 這兩枚是風痕影提供的...


註: 感謝 neo-design 提供兩枚

新增 MyShare 與 我的部落格觀察

感謝 智邦生活館 的知識長 (jeph) (見 部落格觀察資料) 的協助,
提供 API 讓我們抓取 MyShare 的人數,
雖然花了好久時間才抓完 (因為前面有 IPS),
所以今天晚上才正式列為 Attention (重視度) 的分數之一,
但也因為漸漸有人在用 我的部落格觀察,
因此也列入重視度的分數之一...

而最近也在抓取 HemiDemi 所有網頁摘入數,
雖然這數字可能會有問題, 所以不放入重視度如此敏感的指標,
會加入影響度的平方之一, 以及把差距加上總分..
即使不夠正確, 但也至少對文章內有被摘入的人一個獎勵...

編按: 後來 jeph 跟我說, 應該要寫 :
"也要感謝智邦生活館的程式師Kej寫出程式和智邦總經理roach同意提供這項API"

2006/10/19

部落格觀察討論 (3)

這次繼續貼出有討論到 Blog Look 的 Blog 與網站,
因為只列出 20 個, 其他的以後再列囉..:)

1. Web2.0 viewer: Blog Look -top list of Taiwan blogs
2. To Be Or Not To Be: “部落格观察”和《Python检查你的站点的人气》
3. “部落格观察”推出Blog排名 | 追梦
4. Wangtam: 部落格观察的网志排名
5. » 部落格观察:台湾Blogger排行榜 | 未完成 - Incomplete
6. Jas9 Taipei.: 零整篩濾的穿透社群
7. 草根的力量'blog: “部落格观察”推出Blog排名
8. My Program :: Blog Look - 部落格觀察
9. 【 抱風伴靜 Memostorming - 風痕影的部落格 】 - 部落格觀察推出圖像貼紙!
10. huixingの日記
11. 喵老大部落格
12. 歲月的容顏: 【隨手記】也是部落格
13. 謎幻貝兒窩 - 部落格觀察
14. 為了部落,噢不,為了PR! at 餅乾大事紀
15. shoppingyang@china @taipei - 公式真奧妙
16. The View from Taiwan: Top 100 Chinese Language Blogs
17. 部落格觀察 / Blog Look - http://look.urs.tw/ at whatup 的 blog
18. Kirin Lin » 本誌部落格觀察
19. Blog排名 - It Talks
20. 阿茲海默行館:想不想知道你部落格的排名呢?

當然除此之外, 包含工作人員都有新文章

不只是捷運日記
1. 認領部落格之後
2. 部落格觀察的感謝名單
3. 在部落格觀察觀察部落格
4. 不只是部落格觀察的部落格觀察

野貓的零碎生活片段
1. 部落格觀察 Blog Look - Technorati 的操弄
2. 部落格觀察 Blog Look - 成長記錄以及探討
3. Blog Look 頁面改版


2006/10/18

有關活躍度

這的確是從 RSS 來抓文章數後, 所計算的一個分數,
但存在幾個問題, 見MyZilla 官方部落格: 文章數,
所以短時間內不會拿來作為排名的依據,
因為即使不管這些問題,
必須也要等一個月資料完整才能納入計算...

因此目前只給大家做參考...

但最近做了不少彩蛋, 大家可以踩踩看...

2006/10/17

認領Blog

因為野貓寫了認領機制,
所以第二階段的部份可以提前起跑,
請大家註冊一下部落格觀察,
然後認領自己的 Blog, ..
有問題的話請在後面回應一下..:)
應該還是有不少 Bug..

但這次 wildcat 想出不錯的認領機制,
比其他系統有更高的確認性...

而一些功能會先起跑, 見 認領部落格之後

2006/10/15

有關 Delicious 與 Hemidemi

Delicious 因為從知道多少人摘錄這段出問題,
所以上星期已經不再更新, 會暫時凍結到問題解決,

而發現 Hemidemi 已經可以在不影響的情型下抓到數值了,
所以在重視度增加 Hemidemi, 而這段時間將不加入 Delicious 為排序依據...

2006/10/13

目前前 1000 大 BSP 分佈

因為很多人向我們要這資料,
所以公怖在這邊

Wretch: 216
Yam: 151
Xuite: 59
sina: 53
Blogspot: 52
Chinatimes: 47
Webs-TV: 30
IThome: 15
ETToday: 8
UDN: 10
MyPaper: 4
wordpress: 4
fc2: 3
Yahoo: 1
Others: 347 (1000)


那前 300 大則是...

Wretch: 64
Yam: 36
Xuite: 17
sina: 11
Blogspot: 20
Chinatimes: 9
Webs-TV: 5
IThome: 1
MyPaper: 1
wordpress: 1
fc2: 1
Others: 134 (300)

2006/10/12

新改版

這次的新改版,
最主要是撰寫 "Blog 資訊" 所做的改版,
主要的幾個功能包括:

1. 把貼紙頁獨立出來
2. 把歷史演化顯示出來
3. 提供相關 Blog 的參考
4. 用貼紙者也會有歷史參考
5. 目前搜集文章數目

但因為資料不夠多,
還沒辦法畫成長圖...

也會陸續增加新的貼紙....
包含風痕影所提供的幾張底圖..
且這次的版面主要是由 wildcat 所修改,
請大家提供意見...

2006/10/11

文章數

目前文章數是透過 RSS/Atom/RDF 等的 Feed 抓取的,
對於不提供 Feed 或內容不包含日期時間的,
可能就沒辦法記錄...

目前已知的如下:

1. Xuit 沒有提供
2. 明日報新聞台
3. 有些自己架的 System 也沒提供 pubData, issued 等 tag..

短時間之內不會把這個列為統計依據,
但會做為使用者閱讀的參考...

2006/10/03

關於部落格觀察的正式對外說明

【關於部落格觀察】
部落格觀察,是一個可以即時偵測blog成長和排名的一個小工具。它總合了搜尋、連結、訂閱RSS、網摘與輪播的各項數值,經過公式的計算組合後,產生各種分數與排名;最重要的是,華文世界的bloggers可以直接拷貝語法使用喔!

【關於部落格觀察的成員】
目前投入部落格觀察的主力成員有三位:食夢黑貘愛麗絲野貓,主要由食夢黑貘野貓負責程式的撰寫和偵錯,愛麗絲則負責增補及審核資料,並找出更多可以加入評分的參數。當然,對外的非技術說明也是由愛麗絲負責,技術說明則由食夢黑貘負責。

【目前的進度】
目前的進度其實已經超前原設想的進度甚多,我們還在對程式本身與參數做更深入的調校,並且參酌使用者的意見試圖加入更多可用參數,讓部落格觀察更具有公信力;資料部份則先以繁體中文或台語文寫作的blog為主,港澳新馬地區及內地的華文blog暫不列入排名,待第二階段程式開發完成後再一併納入進行排名與統計。

【歡迎給予建議及指教】
我們歡迎各位給予使用上或參數上的任何建議及指教,請在此篇寫回應喔!若有即時需要處理的問題,請回應在部落格觀察首頁的即時留言版,會有專人(也就是三位主力成員之一)負責解決與回覆。

部落格觀察工具

寫了幾個給大家利用的工具...

1. Firefox 使用的 Search Box Plug-In,
一個是透過 MyZilla 一個不是, 請大家選用...

2. 一個 One-Click 的連結,
一個是增加新的網址用, 一個是搜尋用,
通常是只有少數機會會用到前者...

3. Google Tool Bar目前只有搜尋的功能,
以後會想要做成像 Alexa 那樣,
但可能要 Mouse Over 才行....

網址是在 http://look.urs.tw/tools.php

上週進步榜

發現還有很多 Bug 要來修,
所以可能進步榜的名次只會有一個,
其他的就可能會放在貼紙讓大家參考,
網址在 http://look.urs.tw/progress_rank.html

部落格觀察的Ping Track

請大家若討論到部落格觀察, 可以 Ping 一下這一篇...

1. 部落格觀察的第一篇

2. 愛麗絲的部落格觀察─華文版的Blog Influence

3. 在工程師級的顧問的第一篇

4. 部落客的「新價值論」 (Mr. 6)

5. 喜歡就是淡淡的愛,愛就是深深的喜歡 - 【BLOG小玩意】部落格觀察

6. ◤閃靈◢ - Blog評分

7. 轉化之記憶: 2.0的排序操弄l

8. 程式者的胡言亂語 : 一個程式者的胡言亂語

9. 部落格觀察 - 意外的名次 - 我的世界‧我的天

10. Xuite日誌:彎彎佈告欄

11. IX blog beta:部落格觀察指數排行榜

12. 艾薇的悄悄話 - 【資訊】部落格觀察-Blog Look

13. 馬修的研究室 - 馬修網誌

14. Jinn's Tech Blog:部落格觀察 / Blog Look --- Blog排行榜

15. 一生懸命

16. 野貓的零碎生活片段

17. None ? 部落格觀察 / Blog Look

18. 喲哪桑 speaking: 部落格 大排行

19. MingWangX ? 韓寒在部落格觀察

20. Avant Courier ? Avant Courier升級至2.0.4及最近試用之網路服務

最後, 謝謝大家注意到這服務..:)

2006/09/29

歷史更新的RSS Feed

雖然站方會提供每週的分數排行,
但並不代表每次更新會記錄起來,
因此提供 RSS Feed 讓大家自己 Keep 記錄,

網址為 http://look.urs.tw/rss.php?BlogID=?
這個 ? 就是 BlogID 號碼..:)

新加入的參考指標與影響的指數

加入下面幾個參考指標

1. Technorati
2. Bloglines 的訂閱數
3. del.icio.us 收入數
4. furl 的收入數

因此增加與修改一個指標

1. 增加重視度(Att!), 為所有訂閱與收入書籤的加總
2. 總分也加入上面的數目
3. 指數是加上重視度與 Technorati 的三項分數獨立取 Log
4. 影響度變為 Google Link + Technorati Link + Blogger Link(and URL) 與 Yahoo Link 相乘開根號的結果...

請大家提供意見

2006/09/16

目前輸入資料的人..


大概有
40% 是由 Alice 所輸入
30% 是由 Gene
10% 是由 amaryliss
5% 是由 Amykaku
5% 是由 wildcat
10% 是由其他, 如 Murphuy, ... 等人所貢獻...



我猜想...
前 20 名應該最多有 2 名的未輸入,
前 50 名應該是有 5 名之內的誤差,
前 100 名約有 20 名的可能性.

部落格觀察 (Blog Look) 開始...

目前分數的來源:

1. Google Search 包含 http:// 的網址的頁數
2. Google Search 不包含 http:// 的網址的頁數
3. Google Search 連結到此網站的數目 (link:xxx)
4. Yahoo Site Exploere 連結到此網站的數目 (link:xxx)
5. Blogger Blog Search 此不包含 http:// 的網址的頁數
6. Blogger Blog Search 連結到此網站的數目 (blogurl:xxx)
7. Blog Influence 的分數 (不包含 Bloglines)

Blog Score: 前 7 項加總
Blog Index: 前 7 項取 Log 加總
Blog Influence: (3+5+6)*7 然後開跟號
Origin: 原本 Blog Influence (7) 的分數

Blog Rank: 是前面四項排名名次加總由小到大的排序

本系統會以 Blog Rank (名次) 為主,
而 Score 可以說是 Blog 的量與人氣,
Index 比較接近質與量的均衡指標,
Influence 是被連接所造成的影響數,
Blog Influnce 是以國外的觀點的影響數.

2006/08/28

MyZilla 計劃

目前已經開始運作的包含:

1. MyZilla Project
2. MyMovie Sub Project
3. MyBlog Project
4. 我的心情 (mood.urs.tw)
5. 我的門口 (door.urs.tw)

計劃中的包含

1. W2.Ob
2. 聯播