2009/05/27

有關 Technorati 與 BlogInfluence 的問題...

事實上要最感謝的是 LV Chen, 他提醒了我很多事情, 所以也做了一些思考, 發現我最近在低潮期時的確思考不夠周密, 很多該遵守的立論都走偏了, 因此重新思考後, 有下面的結論:

1. 這投票當然不想寫成: "此投票僅供工作人員參考", 所以設定為不是意見調查, 而是投票..
2. 但事實上用投票來決定一個 "機制法理" 也是怪怪的, 所以真的應該是重新檢視這機制...
3. Technorati 與 BlogInfluence 不會拿來做大項的排名標準, 但在 "正確" 運算下, 應該也是須要納入其他的計算.
4. 當一個系統無法正常運作且無法補回時, 應該停止計算參考, 例如這次決定不計算 Yahoo Web
5. Funp 當時以為人數太少, 而放進許多參數, 此時是否應該重新檢視..

當然當時說出的幾項計算分數原則不該改變:

1. 能拿到的資料, 能夠被計算就算
2. 若一個資料被限制在須要 "作者" 做動作才能被計算的, 不應該採用
3. 若一個資料對某些BSP與網址失效時, 也不該被採用
4. 若一個資料是被限定某些 BSP 才能使用時, 也不該採用

因此在這次投票/調查的意見, 應該會加註兩條

5. 當一個資料永久失效時, 不該繼續採用
6. 當一個資料無法更新或無法取得時, 將暫時不採用, 一直到可以更新或取得

但所謂的 Technorati 與 BlogInfluence 的大項, 本來就在這法理之外, 所以可以不列入排行, 但這資料當未來可以取得或更新時, 應該還是會列入其他的項目之中.

上面四項是不應該改變的...

1. 而點閱數排行榜是重要, 但不會列入部落格觀察總排行榜是基於第二點理由.
2. 而當時 "成長榜" 或 "近期榜" 失效, 的確是很大的問題, 應該早時間修復.
3. 是否在有新的 "近期限定" 的資料源, 或是且獨立一個排行榜是該做的.
4. 在 "活躍度狀態" 可以知道部落格是否有在更新.

對於所謂 "霸占" 與 "作弊" 等等, 事實上也是在排行困擾許久, 甚至曾經想設定 "作弊" 的標記, 但在機制上真的很難去做出較合理的方式, 唯一的方式就是由人去跟 Google 等資料員作檢舉的動作後, 當分數被歸零時, 這邊的分數就會跟著變...

而今晚 (應該是清晨了) 將嘗試作一次新分數計算的規則, 看看程式有沒有寫錯的地方, 而所謂排行榜不盡 "人意" 的部份, 應該用其他方式來解決...

btw, Technorati 與 Bloginfluence 的失效將近半年這段時間, 但當時的確以為很容易解決沒去做調整, 這才是最大的問題, 這才是應該列為機制來去實行與改善的地方, 尤其希望有誰能夠幫忙這部份, 或許能夠讓排行資料更完整.

13 則留言:

KUSO 提到...

感謝黑貘的努力

可是,僅容我對這一點作質疑;
2. 若一個資料被限制在須要 "作者" 做動作才能被計算的, 不應該採用

我認為本來就應該考慮進去一些'作者'動作為參考因素。

回歸部落格基本定義,本來就是一個以'作者'為主的基本組織。

你為什麼會去讀某一家部落格?一定是對'作者'文章內容有興趣才去的。我不會因為他是啥排名有進前300去讀他!

個人認為「點閱率」仍是個重要指標。目前被認為大型有名的部落格站台,每天都有很可觀的點閱率

而且只要考慮ip等因素,他實在比「連結數」難操控很多

無論如何,如今決定「當一個資料永久失效時, 不該繼續採用」是絕對正面的
。也希望部落格觀察能繼續朝更公正、更讓人信服的方向發展。

Rookie 提到...

從頭看來很多點都很怪

1.不採計"已經停止更新或不好取得更新成績",站長群早該決定出來。一個拿停滯半年未更新的資料拿來作"排名依據",要拿掉應該果決明快,牽拖一堆人吵架是怎樣= =

2.站長群一邊說"很忙無法處理",結果就是放任那些久未更新甚至早已倒站卻一直佔據前面名次的部落格在那不管。

一邊又不接受"開放程式原始碼"提供能人之士參與修改。

一邊又在講不怕得罪"任何"部落格
一邊又為了要不要拿掉個早已停止更新的成績在那扭扭捏捏

拿明朝成績幫大家排清朝名次,真的很令人傻眼!!= =


3.不是我要嫌站長是雙面人,只是站長在自己部落格提過這邊最大問題就是沒有考慮最近的發文頻率、也沒有考慮點閱數的高低卻又在這邊說這些數據是"作者要有動作才能被計算、不能採用"(這句話是啥邏輯?)

真是典型自我矛盾= =


建議要改就改大點,否則部落格觀察站恐怕永遠都只能維持如現況(排名沒啥人信服網站也沒啥人知道)..當然某些人要認為現況就是最好的了也沒差= =

黑貘/Black Tapir 提到...

事實上 Rookie 說得對, 應該果決明快才是重點, 每次很多計劃都被一直拖延是不應該的, 這也沒甚麼好辨解及該道歉的...

而這個所謂 "必須作者做動作" 的事, 基本上只會造成更多的不公平, 前面這四條是開站前幾天就確認的, 不是最近才跑出來的...

點閱數排行榜是必須有足夠多部落格使用才會生效, 這個是一開站前不可能有意義的數字, 甚至做下去的話, 好像這排行榜在 "懲罰" 不用貼紙的部落格, 懲罰不用 "Feedburner", "MyBlogLog" 等等的部落格...

至於 Rookie 所說的矛盾問題, 有可能是真的, 只是原本設定是希望建立更多面的排行榜來補足, 用更多的層面來看, 而不是單一排行榜, 因為每種層面都有不同的角度與限制沒錯..

而開放原始碼的部份, 可能是最麻煩的一件事, 因為單單處理認證與更正的問題, 超乎業餘能夠處理的, 所以現在頃向希望有心的人能夠加入幫忙, 而不是用開放原始碼的方式來做..

(上面說的認證, 應該說是如何知道資料源的正確性等等的問題)

http://blog.kaishao.idv.tw 提到...

KUSO 老兄一直強調「點閱數」,我也認為這個非常重要,甚至應該是部落格指數裡最重要的一個指標,就像一個產品是否成功,銷售數字最重要;廣告出國比賽得獎,代言人漂亮,牌子老、知名度高,那都是次要的。

可是呢,「點閱數」這個數字並不是所有部落格都可以抓得到的數字

1.有貼部落格觀察貼紙的部落格都可以取得點閱數,可是有貼貼紙的部落格恐怕不到台灣全體有在活動的部落格的十分之一。

2.Y!奇摩部落格是會在側邊欄顯示日點閱數、總點閱數,但這數字能不能用機器抓得到,我對此技術不懂,但用手工抄是可以的......(逃)

3.有些部落格是有參加Google Analytics,Yahoo!站長工具,SiteMeter,ClustrMaps等等可統計點閱數的,又回到第一點,有參加的大概都不到台灣有在活動的部落格總數的十分之一。

簡單說點閱數絕對是最重要指標沒錯,但因為不是所有的部落格都可以抓得到這項指數,所以列入做排行的根據,當然是有不公平的問題了。

拆組達人 提到...

真是辛苦了!
一個公正客觀的評量系統本來就是一個難事!
大大們願意付出自己保貴的時間
就值得肯定!
希望觀察能愈來愈好!

KUSO 提到...

不知是否自己表達不清楚,但必須強調的是,"點閱率"這個因素據我所知,這個站就已做到能夠輕易讀取該數據。(請從首頁連進來,右側欄位確實有個「點閱數排行榜 New!!!」功能)

並非樓上kaishao所提是個難以抓到此數值。

當然前提條件似乎是對方必須有使用貼紙,或是有更多使用限制,這可能要黑貘說明。

我要強調的是,想要排名更客觀、更令人信服。目前現有的方法就是「盡可能地加入一切可以參考的數據」。這當中包刮點閱率因素。


直接了當地說,目前部落格觀察站的計算排名方式,根本都只參考所謂的「反向連結」。也就是一個網站建立的反向連結只要夠多(不管是不是作弊來的),他就可以名列前矛-無論他多久沒更新。

這也是造成目前部落格觀察站排名如一灘死水最大原因。

因此我建議改革,最直接了當的方法當然就是-不要只考慮連結數這個因素,而應該參考更多已經可以抓取的數據。

我隨便給個公式
 總排名=(Google連結數排名+點閱率排名+活耀度排名+PageRank排名)/權重

 權重值=如果這個網站因為任何因素無法取得點閱率排名,則權重自動-1,也就是該網站不考慮這因素。


當然這只是最簡單最粗淺的公式。漏洞可能很多,但只要大家願意討論相信會有結果。

我要強調的就是「要盡可能考慮更多數據,才能達到最客觀的排名公式」。

而非現在「連結數==一切」的作法~

畢竟站長黑貘似乎也在自己網站表達過,如今排名最大盲點就在沒算點閱率也沒算活耀度...所以希望提出來給大家討論看看。

http://blog.kaishao.idv.tw 提到...

KUSO你好像一直抓不到重點。

你講那個點閱排行榜,是有領部落格觀察貼紙的,才會列入。

有多少部落格來領貼紙呢?

http://look.urs.tw/summary.php

還未超過2萬個。

台灣有多少部落格呢?最寬鬆的估計,超過100萬是有的。(有部落客一人好幾個,有人為了能在別人部落格留言只好去註冊一個空的)

部落格觀察是以台灣、台灣人的部落格為母體,加入排行的部落格並不需要來此註冊、認領、領貼紙。

匿名 提到...

連結數所佔比重很高,
在好幾個地方重複計算,
但若有不少人公然徵求交換連結以換取排名呢?

以下這例子,就是某部落格寫的

"交換連結為提昇彼此Page Rank排名之最佳途徑,歡迎各位有部落格或是個人網站的朋友與XXXX交換連結,XXXX創立於 2005年,目前XXXX之日流量約在 2 萬人次、Page Rank 值為 5,與本站交換連結對貴站之PR值提高有一定之幫助"

這麼擺明了要玩排名,
(該部落格名次的確也始終在前一百),
是不是沒法稍稍防止,或使這等行為效果減低?

順帶一提,
該部落格連點閱數也很神,
部落格本身的計次被隱藏了,
從去年底起blog look總點閱數暴增,越來越高,
最近到達其自稱之"2萬人次",
奇妙的是,每天2萬,
但首頁進去許多文章本身點閱數甚至不到100?

(且他文章不像有些人設定全部顯示的)
另,據觀察,有幾篇點閱數破千的下載文,
都是發文許久之後,才突然暴增數字.
不推斷原因,只是覺得,這很奇妙.)

點閱數是不被計算沒錯,
但每天掛在熱門菜單跟部落格日/周/時報,
也會增加google連結,
有沒有影響,還是有...

是不是站方可以用宣示性的公告,
例如,一經檢舉(站方不必主動查察)
玩排名/徵連結查證屬實,
就取消名次or降低個N百名(視情況定數字),
多少可遏止歪風?
真正熱門的部落客根本不會用這種方法.

那種很刻意搞名次的人,
也只有排名對他們有作用了.
(要私下搞查不到的話也算了,
好歹狀況可減輕,
也不會讓越來越多本來不知玩法的人看到就跟著玩)

黑貘/Black Tapir 提到...

to 暱名:

我剛查了一下, 我注意的是點閱數的問題, 但我看了一下, 其點閱數的確有 2 萬沒錯, 我也直接去 http://ad.blog.yam.com/hits/action.php?id=449406&type=blogSite&op=showoneday 看的確有這點閱數, 昨天 IP 也分佈 12000 筆, 唯一可能的是被其他 iframe 包起來外, 我無法確認有可能作弊, 甚至分部 667 個網址, 單一 IP 最高只有 48 次等等...

而交換連結的確是一個大問題, 只是主動交換連結還是被動加入, 對於這種是否公開徵求交換連結這件事, 很難用操作定義...

黑貘/Black Tapir 提到...

to 暱名:

經過我幾種跡徵來判斷, 應該可以証明他沒有對點閱數作弊..

但若用 SEO, 主題(熱門) 等等來去判斷, 這樣就會帶一個有色眼鏡了, 畢竟他並沒有造假帳號, 去侵擾別人的情況,...

匿名 提到...

To黑貘,

您提到的"主動交換連結還是被動加入"
當然,要有證據,非由自由心證認定.

情節由輕到重,如下數例

.收到某人的email要求交換

收件者可檢舉
=>防亂槍打鳥,任意寫信找不認識的人加連結
若雙方尚有交集,
或收件者覺得,那自薦的部落格還不錯,
就不至於檢舉


.在部落格留言要求交換

剛剛隨便google到,
另一樂於交換的部落客留過這樣的言:
- 是否能和你做友站首頁連結!
XXXXX已加入你的連結了^^)
- XXXXX也來和XX交換連結^o^


.公開徵連結&教導如何玩排名文

站方得知後,總可以對這款,
"開誠布公教育大家玩殘部觀"的文有所動作吧,
對如此刻意破壞機制意義的行為,
實質上,不能"懲罰"啥,
不用坐牢,也不可能罰款,
最有效的,也只有降名次不是?


"其他網站/部落格,自發性將該部落格置入連結,
表現對該部落格之重視或認同"
--如此,排名積分計算連結數才有意義對吧.

那種到處凹連結,一字排開幾十上百的,
吃相難看就罷了,人人格調不同不須強求,
但對不屑/不知這種玩法的人,也不公平,
形同壓低不玩者的名次..
這算不算部份使用者權益被侵害?

不是希望站方針對誰,
故不直接貼出那些部落格,
站方本就不可能monitor所有部落格,
但宣示性的公告很重要,
搭配檢舉(為減輕負擔也可限定每月受理件數)
也算規勸某些搞爛排名者,
少耍小伎倆...

匿名 提到...

To 黑貘

上次您判斷"應該沒在點閱數作弊"的部落格,
最近一陣子數字暴跌到一天僅幾十,
並非沒新文,只是每天兩萬人突然消失??

只能說"感覺很像"最近忘了玩這個部份才…

黑貘/Black Tapir 提到...

to 暱名:

看樣子又有高手出現了, 因為之前灌點閱數都是特定 IP, 而他用的是上萬個 IP...

若不是用 proxy 就是用木馬了, 或是 ip masquerading..

唉... 這種事還這樣做挺無趣的..