婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av

主頁 > 知識庫 > 標貝科技繆冠瓊:AI數(shù)據(jù)標注機器比重提升,但不可能完全取代人工

標貝科技繆冠瓊:AI數(shù)據(jù)標注機器比重提升,但不可能完全取代人工

熱門標簽:電銷機器人是不是不用那么累了 什么通電話機器人 河南精確外呼管理系統(tǒng) 福州哪里有羿智云外呼系統(tǒng) 來安百度地圖標注 西安美食地圖標注 閑魚地圖標注店名 海北高德地圖標注位置怎么弄 電話外呼營銷平臺系統(tǒng)
  
  文|AI前線
  作者|劉燕
  AI前線導讀:如果將人工智能比作火箭,那么,數(shù)據(jù)就是助推火箭上升的燃料。機器學習依賴大量的已標注數(shù)據(jù),數(shù)據(jù)標注讓機器理解并認識世界。數(shù)據(jù)標注是人工智能發(fā)展過程中不可缺的一環(huán),是AI金字塔構(gòu)建的基礎力量。與AI臺前的繁榮、高光形成鮮明對比的是,數(shù)據(jù)標注往往居于幕后,常被人忽視,也受到一些偏見,血汗工廠、AI富士康、新型民工...隨著AI深入落地對數(shù)據(jù)提出更高的要求,數(shù)據(jù)標注行業(yè)也從草莽生長階段逐漸過渡到更精細化的成長期。
  01 AI金字塔背后的數(shù)據(jù)標注
  數(shù)據(jù)是機器學習的基礎,機器學習建立在數(shù)據(jù)建模基礎上,豐富的標簽是機器學習成功建模的前提。監(jiān)督學習是目前應用最廣泛的機器學習算法,該方法強依賴標注數(shù)據(jù),它通過學習大量標注的訓練樣本來構(gòu)建預測模型。深度學習也需要大量數(shù)據(jù)的投喂,以深度學習為代表的機器學習框架都需要在大型的監(jiān)督數(shù)據(jù)集上進行訓練,百分點首席算法科學家蘇海波曾表示,深度學習只有在擁有充足標注數(shù)據(jù)的場景下才能發(fā)揮它的威力,但在很多實際的應用中卻沒有足夠的標注數(shù)據(jù)。
  AI技術(shù)在全場景的落地以及大數(shù)據(jù)時代的到來產(chǎn)生了海量、指數(shù)級別的數(shù)據(jù),數(shù)據(jù)獲取也相對變得容易,然而,想要獲得大量的已標注數(shù)據(jù)卻并不容易,往往需要付出很大的人力、物力、財力成本。在醫(yī)療AI等專業(yè)門檻較高的細分領(lǐng)域,缺乏標注數(shù)據(jù)就成了阻礙行業(yè)發(fā)展的絆腳石,騰訊優(yōu)圖實驗室總監(jiān)鄭冶楓曾在接受AI前線采訪時表示,醫(yī)療數(shù)據(jù)標注難一方面體現(xiàn)在頂尖的醫(yī)療數(shù)據(jù)標注人才缺乏,另一方面,臨床、科研任務重,很多醫(yī)療專家沒有時間和精力做數(shù)據(jù)標注。
  數(shù)據(jù)標注主要是針對語音、圖像、文本等進行標注,主要通過做標記、標重點、打標簽、框?qū)ο蟆⒆鲎⑨尩确绞綄?shù)據(jù)集作出標注,再將這些數(shù)據(jù)集給機器訓練和學習。數(shù)據(jù)標注的類型主要有:拼音標注、韻律標注、詞性標注、音素時間點標注、語音轉(zhuǎn)寫、分類標注、打點標注、標框標注、區(qū)域標注等等。由于需要標注的數(shù)據(jù)規(guī)模龐大且成本較高,一些互聯(lián)網(wǎng)巨頭及一些AI公司很少自己設有標注團隊,大多交給第三方數(shù)據(jù)服務公司或者數(shù)據(jù)標注團隊來做。
  數(shù)據(jù)服務是標貝科技的起家業(yè)務,自2016年成立以來,標貝科技為BAT、AI獨角獸等多家公司提供過語音、圖像、NLP數(shù)據(jù)的采集、標注等服務。據(jù)標貝科技數(shù)據(jù)負責人繆冠瓊介紹,標貝有自研的采集標注平臺,包括長語音(對話、持續(xù))標注平臺和短語音(十幾秒)標注平臺,AI語音合成數(shù)據(jù)標注平臺、數(shù)據(jù)工場APP等。在標注平臺的選擇上,會依據(jù)圖像、語音數(shù)據(jù)、數(shù)據(jù)來源、客戶需求等綜合決定。以語音合成數(shù)據(jù)標注為例,會標注其音字、韻律、音素時間點、詞性等標簽。
  人工智能的繁榮催生并壯大了數(shù)據(jù)標注行業(yè),也創(chuàng)造了大量的就業(yè)崗位。有數(shù)據(jù)顯示,目前中國的全職數(shù)據(jù)標注從業(yè)者有約20萬人,兼職數(shù)據(jù)標注從業(yè)者有約一百萬人,全國從事數(shù)據(jù)標注業(yè)務的公司約有幾百家。
  02 數(shù)據(jù)民工?
  在數(shù)據(jù)標注行業(yè)流行著一句話,有多少智能,就有多少人工。數(shù)據(jù)標注是人工智能發(fā)展中至關(guān)重要的一環(huán),卻常常容易被人忽視。
  相對而言,數(shù)據(jù)標注是人工智能領(lǐng)域入門級的工種,單從工作流程看,其技術(shù)含量較低,人是這項工作中最大的影響因素,久而久之,勞動密集型成為外界給數(shù)據(jù)標注行業(yè)貼上的一個標簽。低門檻吸引了眾多農(nóng)民、學生、殘疾人群體加入到數(shù)據(jù)標注大軍中,在我國河南、河北、貴州、山西等地的四五線城市還出現(xiàn)了一些特色的數(shù)據(jù)標注村。
  不止中國,向勞動力更充足、成本更低的地方遷移也是全球數(shù)據(jù)標注行業(yè)的發(fā)展趨勢。印度涌現(xiàn)了不少數(shù)據(jù)標注村,他們?yōu)槊绹W洲、澳洲和亞洲的AI公司服務,F(xiàn)acebook就曾將部分社交內(nèi)容標注的工作外包給了一家印度公司。
  上述務工者也由此成為了人工智能浪潮中的參與者,盡管待遇上遠遠少于其他人工智能從業(yè)者,但相較傳統(tǒng)的體力工作,數(shù)據(jù)標注員的工作倒是更輕松,體面。不過,硬幣的另一面是,這項工作流程簡單,單調(diào)乏味,數(shù)據(jù)標注員日復一日重復畫框的工作...。。關(guān)于數(shù)據(jù)標注行業(yè)是臟活累活、數(shù)據(jù)民工的論調(diào)也四散而起。
  對于這些聲音,繆冠瓊并不認同。
  我覺得(它)不是‘臟活累活’行業(yè),因為這并不是一個什么人都可以做的工作。AI本身發(fā)展很快,隨著應用產(chǎn)品落地,對數(shù)據(jù)的要求越來越高,對數(shù)據(jù)采標人員的素質(zhì)也提出了高要求。考慮到外包團隊服務質(zhì)量難以把控等因素,標貝科技所承接的項目主要依靠自有數(shù)據(jù)標注團隊,其在天津、長春等城市設有數(shù)據(jù)團隊,兼職人員則視項目大小臨時擴容,遴選兼職人員時更考慮專業(yè)水平,要求具有語言、方言背景,或者有數(shù)據(jù)標注經(jīng)驗,無經(jīng)驗者要經(jīng)過至少6個月培訓。
  繆冠瓊表示,數(shù)據(jù)標注行業(yè)的發(fā)展越來越趨向于專業(yè)化,早期多以中文數(shù)據(jù)標注為主,現(xiàn)在隨著多語種、方言、個性化標注等發(fā)展標注需求的增加,并不是隨便拉來很多人就可以做的,需要專業(yè)的人才。此外,血汗工廠這種情形多出現(xiàn)在行業(yè)早期且多針對于只有數(shù)據(jù)標注一項業(yè)務的小團隊,它們承接不了一些復雜的、定制化的項目。從工作量上看,結(jié)合客戶需求,以語音標注為例,標貝科技的數(shù)據(jù)標注員一個人工作一天的有效標注語音時長為1小時。
  03 機器標注比重提升,但不可能取代人工
  蠻荒時代已過去了。
  《2019年中國人工智能基礎數(shù)據(jù)服務行業(yè)白皮書》分析指出,2010-2016年為數(shù)據(jù)服務行業(yè)的初生期,早期數(shù)據(jù)標注需求激增,加之入行門檻低,涌入了大量玩家,魚龍混雜。自2017年以來,伴隨著AI深入落地到各個應用場景中,數(shù)據(jù)標注行業(yè)了進入成長期,上層應用端的廠商對數(shù)據(jù)標注質(zhì)的要求不斷提高,如自動駕駛、運動圖像、計算機視覺等領(lǐng)域的數(shù)據(jù)標注難度很高。
  行業(yè)格局漸漸清晰,馬太效應明顯。據(jù)了解,國內(nèi)從事數(shù)據(jù)標注業(yè)務公司/團隊約有幾百家,其中獨立做整個數(shù)據(jù)質(zhì)量服務的約百余家,能夠提供數(shù)據(jù)采標服務一體化的有幾十家,能夠提供高標準基礎數(shù)據(jù)服務的僅有十幾家。現(xiàn)階段,下游AI算法研發(fā)單位多將業(yè)務分流給不同數(shù)據(jù)服務公司加之數(shù)據(jù)標注相關(guān)標準待完善,該行業(yè)還沒有出現(xiàn)大的巨頭公司。
  這是一個尚未飽和的市場,同樣,這也意味著巨大的發(fā)展空間。據(jù)統(tǒng)計,2018年中國人工智能基礎數(shù)據(jù)服務市場規(guī)模為25.86億元,行業(yè)年復合增長率為23.5%。
  繆冠瓊認為,受數(shù)據(jù)安全和質(zhì)量標準不斷提升及相關(guān)數(shù)據(jù)政策出臺影響,一些不滿足行業(yè)標準及客戶需求的將會被市場淘汰。她補充,行業(yè)目前正處于一個上升的、快速發(fā)展的階段,整體在朝著個性化、專業(yè)化的方向發(fā)展,從早期較簡單的、通用的數(shù)據(jù)過渡到更復雜的個性化的、場景化的數(shù)據(jù),對于很多細分領(lǐng)域,需要大量真實的模型進行標注去迭代模型,而非簡單的通用數(shù)據(jù)可以滿足的。
  數(shù)據(jù)標注行業(yè)也已經(jīng)開始進入到人機協(xié)作的階段,數(shù)據(jù)標注市場需求量仍舊很大,需要更加專業(yè)的人及高效的機器協(xié)助,機器標注所占的比重會不斷提升,AI技術(shù)與數(shù)據(jù)互補,通過AI技術(shù)提升數(shù)據(jù)效率,數(shù)據(jù)反過來服務于技術(shù)。
  為降低人工成本,提高效率,不少互聯(lián)網(wǎng)技術(shù)公司及第三方數(shù)據(jù)服務商在開發(fā)自己的標注工具。去年10月,Google發(fā)布了用于完整圖像標注的人機協(xié)作接口Fluid Annotation,利用它標注圖像中每個對象和背景區(qū)域的類標簽與輪廓,可將標注數(shù)據(jù)集的創(chuàng)建速度提高三倍。數(shù)據(jù)標注眾包平臺也不斷涌現(xiàn),京東眾智、百度眾測、figure-eight、亞馬遜的Mechanical Turk等。
  未來,機器標注、人工輔助將成為可以預見的發(fā)展趨勢。這對數(shù)據(jù)標注村來說或許并不是一件好事。但繆冠瓊認為,機器不可能完全取代人工。現(xiàn)階段人工標注的準確度要高于機器,機器只能跑出有一定比例的正確結(jié)果,更精確的結(jié)果仍需要人工來標注,且發(fā)揮的作用更關(guān)鍵。此外,在質(zhì)檢環(huán)節(jié),人的作用也無可替代,標貝數(shù)據(jù)校對采用人工為主的處理方式,采用遵循一審、二校、三驗流程,機器會抽檢、驗收一部分數(shù)據(jù)并給出預處理結(jié)果,最終的結(jié)果要靠精細化的人工校對。
  嘉賓介紹
  繆冠瓊,標貝科技聯(lián)合創(chuàng)始人,數(shù)據(jù)業(yè)務負責人,語音及數(shù)據(jù)領(lǐng)域?qū)<遥袠I(yè)經(jīng)驗超過17年以上,參與多本專業(yè)書籍編寫,在產(chǎn)品與數(shù)據(jù)的場景結(jié)合上有獨特的解決方案。

標簽:東營 銅陵 錫林郭勒盟 巴中 營口 牡丹江 資陽 東營

巨人網(wǎng)絡通訊聲明:本文標題《標貝科技繆冠瓊:AI數(shù)據(jù)標注機器比重提升,但不可能完全取代人工》,本文關(guān)鍵詞  標貝,科技,繆冠,瓊,數(shù)據(jù),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡,涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《標貝科技繆冠瓊:AI數(shù)據(jù)標注機器比重提升,但不可能完全取代人工》相關(guān)的同類信息!
  • 本頁收集關(guān)于標貝科技繆冠瓊:AI數(shù)據(jù)標注機器比重提升,但不可能完全取代人工的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章
    婷婷综合国产,91蜜桃婷婷狠狠久久综合9色 ,九九九九九精品,国产综合av
    91香蕉视频mp4| 国产主播一区二区| 亚洲午夜国产一区99re久久| 国产一区二区三区久久久| 欧美电影影音先锋| 日韩在线一二三区| 日韩一区二区三区在线| 精品亚洲国产成人av制服丝袜| 欧美一区二区在线播放| 日韩**一区毛片| 久久久久国产精品麻豆| 成人网男人的天堂| 亚洲精品成人悠悠色影视| 99精品一区二区| 亚洲欧美日本在线| 4438x亚洲最大成人网| 国产原创一区二区| 成人免费一区二区三区在线观看| 在线亚洲+欧美+日本专区| 视频一区在线播放| 日本一区二区三级电影在线观看| 色婷婷精品大在线视频| 日韩在线a电影| 国产日产欧美一区| 欧美日韩一区二区三区四区| 国产自产视频一区二区三区 | 蜜桃精品视频在线观看| 精品久久久久久久久久久院品网 | 欧美一区二区三区人| 麻豆精品在线视频| ㊣最新国产の精品bt伙计久久| 在线不卡中文字幕| 波多野结衣一区二区三区| 亚洲国产wwwccc36天堂| 国产无人区一区二区三区| 欧美色综合影院| 成人动漫在线一区| 久久99蜜桃精品| 亚洲欧美日韩中文字幕一区二区三区| 91精品免费在线观看| 91在线小视频| 国产一区二区中文字幕| 亚洲成人精品一区二区| 《视频一区视频二区| 久久日韩粉嫩一区二区三区 | 日韩午夜av电影| 欧美亚洲一区三区| 91丨porny丨户外露出| 国产精品中文字幕欧美| 日韩经典中文字幕一区| 亚洲欧美激情视频在线观看一区二区三区| 26uuu成人网一区二区三区| 欧美日韩国产美女| 欧美视频日韩视频在线观看| 欧美在线free| 欧美中文字幕不卡| 欧日韩精品视频| 91麻豆免费在线观看| 成人黄色国产精品网站大全在线免费观看| 奇米综合一区二区三区精品视频| 国产精品你懂的在线欣赏| 精品播放一区二区| 91精品在线免费观看| 欧美日高清视频| 欧美久久久一区| 欧美日韩极品在线观看一区| 欧美性猛片aaaaaaa做受| 色播五月激情综合网| 在线中文字幕一区| 欧美伊人久久大香线蕉综合69| 99re6这里只有精品视频在线观看| 国产精品一卡二| 国产精品一区二区三区四区| 国产一区二区免费看| 国产精品一区专区| 国产一区高清在线| 国产一区二区三区久久悠悠色av| 国产一区二区调教| 国产a精品视频| 不卡一区中文字幕| 色哟哟一区二区在线观看| 色婷婷综合久色| 一本一本久久a久久精品综合麻豆| 色素色在线综合| 欧美日韩日日骚| 欧美电视剧在线看免费| 日韩三级免费观看| 国产婷婷色一区二区三区| 国产精品天干天干在线综合| 亚洲精品自拍动漫在线| 香蕉影视欧美成人| 美女视频网站久久| 国产大陆a不卡| 色综合中文综合网| 亚洲女人小视频在线观看| 最新久久zyz资源站| 亚洲黄色免费电影| 蜜臀av性久久久久av蜜臀妖精| 日韩中文字幕91| 福利一区在线观看| 欧美三级韩国三级日本三斤| 制服丝袜中文字幕一区| 久久女同性恋中文字幕| 亚洲综合色成人| 国产麻豆精品久久一二三| 91在线码无精品| 欧美电影免费观看高清完整版在 | 日韩精品成人一区二区在线| 国产麻豆精品95视频| 色琪琪一区二区三区亚洲区| 91精品欧美综合在线观看最新 | 国产欧美综合在线观看第十页| 亚洲手机成人高清视频| 久久爱www久久做| 在线日韩一区二区| 国产精品午夜电影| 日韩国产欧美在线播放| 国产精品综合一区二区| 色国产综合视频| 亚洲国产成人一区二区三区| 视频一区二区三区在线| 成人网在线播放| 精品国产91久久久久久久妲己 | 国产精品白丝在线| 久久精品噜噜噜成人88aⅴ| 色综合久久久久综合体桃花网| 久久在线免费观看| 日韩经典一区二区| 在线观看免费亚洲| 18欧美乱大交hd1984| 国产一区二区福利| 欧美成人艳星乳罩| 午夜久久久影院| 欧美自拍偷拍一区| 一区二区三区美女| 99视频精品免费视频| 中文字幕av不卡| 国产精品一二三四五| 精品国产一区二区三区四区四| 三级一区在线视频先锋 | 看国产成人h片视频| 欧美高清激情brazzers| 亚洲在线视频网站| 欧洲中文字幕精品| 亚洲综合在线五月| 欧美在线视频你懂得| 亚洲妇女屁股眼交7| 欧美日韩日日骚| 免费的国产精品| 久久久影视传媒| 国产高清精品在线| 亚洲国产精品成人综合| av中文字幕亚洲| 一区二区三区资源| 欧美午夜寂寞影院| 日韩成人精品视频| 欧美成人bangbros| 国产成人免费在线观看不卡| 久久久久国色av免费看影院| 国产精品主播直播| 国产精品电影院| 欧美日韩你懂得| 国产乱码字幕精品高清av | 欧美精品一区二区三区蜜桃| 捆绑调教一区二区三区| 日本一区二区三区电影| 一本一道久久a久久精品综合蜜臀| 亚洲综合久久av| 欧美岛国在线观看| 成人中文字幕合集| 亚洲国产日韩a在线播放| 宅男在线国产精品| 成人网在线免费视频| 亚洲乱码中文字幕| 8x8x8国产精品| 成人激情动漫在线观看| 亚洲一区二区高清| 日韩欧美一二三| 本田岬高潮一区二区三区| 日韩综合小视频| 亚洲国产精品ⅴa在线观看| 在线影院国内精品| 国产一区二区精品久久| 亚洲精品免费一二三区| 精品99久久久久久| av亚洲精华国产精华精| 日本不卡视频在线观看| 国产三级欧美三级| 欧美人体做爰大胆视频| 国产凹凸在线观看一区二区| 亚洲成人精品一区二区| 亚洲天堂av一区| 国产欧美一区二区精品性色| 日韩一级片网站| 91久久精品网| 99re这里只有精品首页| 国产精品影视在线| 国产风韵犹存在线视精品| 日本三级韩国三级欧美三级| 亚洲精品菠萝久久久久久久|