国产无码免费,人妻口爆,国产V在线,99中文精品7,国产成人无码AA精品一,制度丝袜诱惑av,久久99免费麻辣视频,蜜臀久久99精品久久久久久酒店
        訂閱
        糾錯
        加入自媒體

        AI的數據、算法、算力“輪流坐莊”,NLP到了“數據為王”的時代

        2020-05-09 08:33
        智能相對論
        關注

        由此,我們再來理解商業機會。

        數據采集與標注的公司有很多,從巨頭的“副業”到AI數據專業化平臺,總體而言主要玩家如圖所示:

        AI的數據、算法、算力“輪流坐莊”,NLP到了“數據為王”的時代

        除此之外,更多中小玩家甚至幾十人的草臺班子數不勝數。在中國,目前全國從事數據標注業務的公司約有幾百家,全職的數據標注從業者有約20萬人,兼職數據標注從業者有約100萬人。

        易入門、難精通,而上述兩大因素決定NLP數據面臨巨大的挑戰,做得好的就更少。

        在數據“坐莊”NLP的大背景下,空出了大量的商業機會,而客觀上的高要求阻卻了大量低門檻入場的玩家,NLP數據相對于CV更像一個藍海。

        打破單純“體力活”標簽,NLP數據采集與標注從四個方面自我演進

        有機會就總有人會進場,不久前,中國人工智能高峰論發布了中國人工智能科技服務商50強,既有商湯、曠視這種明星企業,也出現了榜單內唯一的AI數據服務商云測數據,這顯示AI數據正在進入“主流圈”,在藍海中嘗試跑出獨角獸企業。

        當然,前提是平臺能夠解決好NLP數據的痛點問題。

        事實上,CV的“感知”需求使得“體力活”可能就能夠勝任大多數據生產工作(誰不認識一輛車、一個人呢),而“認知”的NLP數據要突圍,只是“體力活”早已經不夠。

        至少目前來看,行業玩家在四個方面有所動作,或正在解決NLP數據痛點問題。

        1、業務模式,用“定制化”迎合商業落地期的NLP

        曾有媒體向Google工程師提起M-Turk的時候,他表示“我們不敢用Turk標注”,因為回收的數據良莠不齊。

        眾包模式(在公開平臺發布任務,自由申領)是曾經的AI數據產業主流,擁有數據豐富性和多樣性的優勢,不過數據質量比較難以把控。在數據精細化要求的今天,很多需求方都轉向了“定制化”(一對一,以項目制的方式完成交辦的數據任務)服務模式。

        例如,云測數據的“定制化”服務模式,跟的就是需求方復雜、精深而個性化的數據要求。具體到NLP,在數據采集上滿足特定人物(老人、婦女、小孩)、特定場景(家居、辦公、商業等)、不同方言的聲音/文本數據采集;在數據標注上進行需求的對接、理解清楚場景化要求再分發盡量具體的規范指導(同樣一句話在不同交流目的中可能需要標注不同的內容,例如“我沒錢”在信貸服務中意味著潛在客戶,在理財服務中則表達拒絕的態度)。

        當然,眾包模式也有它的優點,能夠輕量化承載大量相對簡單的數據需求,而場景化的定制模式則更專業,主要依靠自有員工和基地,像云測數據就在華東、華南、華北擁有自建標注基地,這種玩法顯然更適合匹配客單價更高的場景化、定制化需求,NLP是典型。

        2、管理流程,從“粗放制造”到“精益制造”

        既然數據采集與標注很像是工廠的流水線,那么如果要提升數據的精準度,其實就如同“制造業”升級那樣需要進行“粗放制造”到“精益制造”的轉變,首要體現在管理流程的優化上。

        無論是從平臺接取任務的眾包團隊,還是直接對接需求方的定制化服務平臺,至少,草臺班子式的做法已經不適合NLP對數據的要求。

        高精準度、高效率,都依賴管理流程的優化,以云測數據為例,具體做法包括這幾個大方向:

        標注、審核、抽檢的層層把關:標注人員的結果交由另一批人進行審核,打回不合格的,最終再由質檢進行抽檢,大體如此,可能步驟更復雜;

        人才類型的基礎分類:文本、語音、圖像標注人員不相互混用;

        擅長場景的優先任務派發:在同等條件下,擅長對應場景的人優先派發給任務。

        例會制度:如同精細化管理的制造業一樣,早會、晚會、周會、月會,總結問題、提醒改進。

        ……

        而無論如何,管理流程的事,說得再多,日常工作的落實才是最重要的。

        3、職業技能,專業培訓擺脫“低水平重復”

        “不要門檻”意味著更低的價值,在人員個人能力上,NLP在逐漸拋棄那些“無門檻”入局的人,尤其是在特定的場景需求下。

        例如,這是一個非常簡單的NLP數據標注實例:

        AI的數據、算法、算力“輪流坐莊”,NLP到了“數據為王”的時代

        <上一頁  1  2  3  下一頁>  
        聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

        發表評論

        0條評論,0人參與

        請輸入評論內容...

        請輸入評論/評論長度6~500個字

        您提交的評論過于頻繁,請輸入驗證碼繼續

        暫無評論

        暫無評論

          掃碼關注公眾號
          OFweek人工智能網
          獲取更多精彩內容
          文章糾錯
          x
          *文字標題:
          *糾錯內容:
          聯系郵箱:
          *驗 證 碼:

          粵公網安備 44030502002758號

          主站蜘蛛池模板: 旌德县| www.日日撸| 亚洲欧洲av| 伊人成人社区| jizzjizz视频| 国产精品一二| 久色资源| 姚安县| 小黄片入口| 人人超碰在线| 秦安县| 久久99视频| 北辰区| 国产香蕉AV| 亚洲AV一卡| 海角社区91熟女丝袜脚国产| 69xxx国产| 男人亚洲天堂| 东辽县| 成人视频AAA| 在线?国产?精品?播放?VA| 新田县| 亚洲成人在线黄网| 国产精品18久久久久久麻辣| 银川市| 国产无码久久| 久久久久8888| 铁岭市| www.91xxx| 国产亚洲合集| 国产精品18禁久久久久久白浆| 伊人69| 综合av| 谁有老熟女网站| 色哟哟精品| 金塔县| 狠狠色AV一区二区| 熟女亚洲观看| 懂色av,蜜臀AV粉嫩av| 太白县| 91福利区|