人才庫ptt的問題,透過圖書和論文來找解法和答案更準確安心。 我們找到下列線上看、影評和彩蛋懶人包

國立臺灣大學 語言學研究所 謝舒凱所指導 黃資勻的 ESemiCrowd - 中文自然語言處理的群眾外包架構 (2016),提出人才庫ptt關鍵因素是什麼,來自於語言學標記、中文、自然語言處理、群眾募集、遊戲化。

接下來讓我們看這些論文和書籍都說些什麼吧:

除了人才庫ptt,大家也想知道這些:

ESemiCrowd - 中文自然語言處理的群眾外包架構

為了解決人才庫ptt的問題,作者黃資勻 這樣論述:

ESemiCrowd 架構藉由加入語言學專家的知識到標記流程中,重新定義針對中文自然語言處理標記,實行群眾外包的概念和方法。ESemiCrowd架構讓花費維持在群眾外包的水平,但卻能夠讓標記資料品質遠高過群眾外包,近乎專家標記。透過較複雜的中文歧義消除實驗,從三個層次來評估群眾外包(CrowdFlower)、專家(Experts)和融合專家到群眾外包(ESemiCrowd)這三種方式的標記成效。第一層次是比較每一種方式裡面,標記者的標記成效。第二層次是比較這三種方法彼此間標記結果的標記成效。第三層次則是比較這三種方法和黃金標準答案之間的標記成效。從最後結果可以看到,融合專家與群眾外包(ESe

miCrowd)的F-measure達到 0.83, 是群眾外包(CrowdFlower)的兩倍; agreement 達到0.72, 是群眾外包(CrowdFlower)的六倍。而這樣的成果,只比群眾外包(CrowdFlower)多花費不到一塊美金。 此架構包含九項聚焦重點:第一,拆解和分配案件的工作流程; 第二,工作流程每個階段的人力配置和責任; 第三,案件分配方式案件分配方式; 第四, 運用最有效也最低風險的方式來吸引能力適當的工作者; 第五, 建立人才庫以縮短分配案件到合適工作者手中的時間; 第六, 在每一個工作流程階段持續進行監視以及品質控制; 第七, 仔細說明標記平台專家的任

務細節,包括完成部分語料前標記、建立標記架構、以及提供工作者教育訓練等等; 第八, 建立制度表揚高品質高作者以及避免工作倦怠; 最後第九,是賦予工作者每項任務的意義以及肯定其貢獻。