今年4月,國(guó)家發(fā)改委首次發(fā)函確定了“新基建”。與前幾輪基建關(guān)注橋梁道路、建筑工程不同,新基建以數(shù)字化、智能化為主基調(diào),圍繞著5G、云計(jì)算、AI展開,全力構(gòu)建信息數(shù)字化基礎(chǔ)設(shè)施,助推我國(guó)經(jīng)濟(jì)持續(xù)飛躍增長(zhǎng)。
作為新基建最核心版塊之一的人工智能,是許多領(lǐng)域數(shù)字化與智能化轉(zhuǎn)型的基礎(chǔ)與關(guān)鍵。在新基建政策推動(dòng)下,人工智能版塊迎來了新騰飛,大批資金、人才流入,一場(chǎng)科技競(jìng)賽即將打響。
據(jù)天眼查數(shù)據(jù)顯示,以工商登記為準(zhǔn),僅5月,我國(guó)新增人工智能相關(guān)企業(yè)就有近11萬(wàn)家,在傳統(tǒng)企業(yè)受疫情影響業(yè)務(wù)收縮時(shí),人工智能產(chǎn)業(yè)逆勢(shì)增長(zhǎng),較去年同比增長(zhǎng)28.54%。新增的企業(yè)分布在AI產(chǎn)業(yè)鏈的各個(gè)層級(jí),而入局門檻相對(duì)較低AI基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)受到青睞。
AI離不開數(shù)據(jù),新基建撬動(dòng)行業(yè)變革
作為驅(qū)動(dòng)AI的三駕馬車之一,數(shù)據(jù)相對(duì)算法、算力,受關(guān)注程度不高,但數(shù)據(jù)的重要性卻是不容忽視的。
在目前主流的深度學(xué)習(xí)框架之下,算法模型十分依賴人工標(biāo)注的數(shù)據(jù),并且短時(shí)間內(nèi),這種依賴還很難改變。
Google AI部門負(fù)責(zé)人Jeff Dean曾在公開課上演示過傳統(tǒng)訓(xùn)練方法與深度神經(jīng)網(wǎng)絡(luò)算法在不同數(shù)據(jù)規(guī)模之下的表現(xiàn),結(jié)果證明深度神經(jīng)網(wǎng)絡(luò)模型的準(zhǔn)確率與數(shù)據(jù)量呈正相關(guān),也就是說,數(shù)據(jù)量越大,算法模型最后的效果就越好。
通常情況下,訓(xùn)練一個(gè)最簡(jiǎn)單的圖像物品識(shí)別算法,需要至少數(shù)萬(wàn)張圖片標(biāo)注數(shù)據(jù);一個(gè)文本審核程序,需要數(shù)十萬(wàn)甚至上百萬(wàn)條NLP數(shù)據(jù)訓(xùn)練;一個(gè)語(yǔ)音交互應(yīng)用,需要數(shù)千小時(shí)的語(yǔ)音訓(xùn)練,并且還得針對(duì)不同口音、不同話題持續(xù)優(yōu)化;而布局一個(gè)智慧城市應(yīng)用,所需的數(shù)據(jù)量更是驚人。
在新基建浪潮下,AI科技企業(yè)為了搶占市場(chǎng),不斷提高算法精確度,并且與許多傳統(tǒng)產(chǎn)業(yè)相結(jié)合,創(chuàng)造新的應(yīng)用場(chǎng)景,因此將釋放出大量的數(shù)據(jù)采集與標(biāo)注需求,涌向市場(chǎng)。
根據(jù)某咨詢發(fā)布的《2020年中國(guó)AI基礎(chǔ)數(shù)據(jù)服務(wù)行業(yè)發(fā)展報(bào)告》預(yù)測(cè),中國(guó)人工智能基礎(chǔ)數(shù)據(jù)服務(wù)市場(chǎng)規(guī)模,到2025年將突破100億元,發(fā)展前景巨大。
AI基礎(chǔ)數(shù)據(jù)產(chǎn)業(yè)引來洗牌期,突圍者會(huì)是誰(shuí)
在新基建的政策推動(dòng)下,國(guó)內(nèi)AI數(shù)據(jù)市場(chǎng)規(guī)模將迎來猛增,玩家逐漸入局分食蛋糕,AI數(shù)據(jù)服務(wù)商之間的競(jìng)爭(zhēng)開始日益加劇,一場(chǎng)突圍賽迫在眉睫。
從市場(chǎng)整體來看,目前我國(guó)AI基礎(chǔ)數(shù)據(jù)市場(chǎng)的競(jìng)爭(zhēng)者主要有兩類。一是中小數(shù)據(jù)供應(yīng)商、眾包團(tuán)隊(duì),這類供應(yīng)方通常盤踞在國(guó)內(nèi)三、四線城市小鎮(zhèn),依靠大量廉價(jià)的勞動(dòng)力,迅速占領(lǐng)市場(chǎng),成為了AI數(shù)據(jù)產(chǎn)業(yè)的中堅(jiān)力量。
但總體而言,這類供應(yīng)模式還屬于勞動(dòng)密集型產(chǎn)業(yè),在市場(chǎng)擴(kuò)張?jiān)缙?能享受到部分紅利,隨著大批競(jìng)爭(zhēng)者的涌入,最終會(huì)因缺乏商業(yè)壁壘,而生存困難。
考慮到長(zhǎng)遠(yuǎn)發(fā)展,許多供應(yīng)商轉(zhuǎn)型,從而誕生了品牌數(shù)據(jù)服務(wù)商這一新模式。
品牌數(shù)據(jù)服務(wù)商從技術(shù)和服務(wù)流程兩方面深化,角色從數(shù)據(jù)提供者,轉(zhuǎn)變?yōu)閿?shù)據(jù)處理專家,通過為客戶提供一站式的數(shù)據(jù)解決方案,來建立自己的競(jìng)爭(zhēng)壁壘。
從市場(chǎng)反饋來看,越來越多科技公司傾向選擇品牌數(shù)據(jù)服務(wù)商。主要原因是品牌數(shù)據(jù)服務(wù)商技術(shù)相對(duì)更成熟,擁有自有標(biāo)注平臺(tái),在規(guī)范性、安全性都更有保障,并且對(duì)于小語(yǔ)種標(biāo)注、NLP、語(yǔ)音合成等難度較高項(xiàng)目,品牌數(shù)據(jù)服務(wù)商也更具優(yōu)勢(shì)。
目前,市場(chǎng)上已經(jīng)涌現(xiàn)了一批品牌數(shù)據(jù)服務(wù)商,但囿于技術(shù)、資金等因素,總體數(shù)量還相對(duì)較少。
景聯(lián)文:專業(yè)數(shù)據(jù)服務(wù)為AI商業(yè)賦能
2012年組建的景聯(lián)文團(tuán)隊(duì)是市場(chǎng)上最別樹一幟的AI品牌數(shù)據(jù)服務(wù)商。景聯(lián)文早期專注于指紋防偽技術(shù),靠算法發(fā)家,2017、2019年連續(xù)兩屆拿下LivDet:Fingerprint Liveness Detection Competition(國(guó)際活體指紋檢測(cè)大賽)全場(chǎng)冠軍。
因?yàn)橹讣y算法業(yè)務(wù)的采集需求,景聯(lián)文在原有基礎(chǔ)上逐漸衍生出了數(shù)據(jù)采集與標(biāo)注業(yè)務(wù),并于2016年正式面向市場(chǎng)開放。
得益于多年指紋采集業(yè)務(wù)的流程經(jīng)驗(yàn),在數(shù)據(jù)來源合規(guī)以及交付保密性方面,景聯(lián)文一直走在行業(yè)前列。
隨著人工智能產(chǎn)業(yè)的發(fā)展,景聯(lián)文乘著這股浪潮,在行業(yè)中迅速崛起。目前景聯(lián)文在全國(guó)范圍內(nèi)擁有5個(gè)標(biāo)注基地,220名全職人工智能訓(xùn)練師;上線了自有標(biāo)注平臺(tái),涵蓋了絕大多數(shù)主流標(biāo)注工具,支持語(yǔ)義分割、拉框標(biāo)注、多邊形標(biāo)注、關(guān)鍵點(diǎn)標(biāo)注、3D點(diǎn)云、2D3D融合標(biāo)注、圖片分類、聲紋識(shí)別、ASR轉(zhuǎn)寫、韻律標(biāo)注、NLP、文本分類、OCR轉(zhuǎn)寫、情緒判斷等多種標(biāo)注業(yè)務(wù);提供企業(yè)私有化部署、跨地區(qū)作業(yè)等定制服務(wù)。
無論是前兩年的行業(yè)降溫,還是疫情期間的斷檔,景聯(lián)文的業(yè)務(wù)都非常穩(wěn)定。
景聯(lián)文CEO鄭曉薇說“景聯(lián)文的發(fā)展方向從來都是能夠?yàn)榭蛻籼峁┖侠怼踩、可靠的AI數(shù)據(jù)解決方案,這是目前市場(chǎng)上非常稀缺的一種競(jìng)爭(zhēng)力。”
而對(duì)于新基建帶來的機(jī)遇與競(jìng)爭(zhēng),鄭曉薇則表示:“我們有信心接住這股浪潮!”
伴隨著一系列的政策紅利扶持,AI技術(shù)將以最快的速度更新迭代,最終將在教育、安防、家居、生產(chǎn)等多個(gè)領(lǐng)域?qū)崿F(xiàn)商業(yè)落地。而為客戶提供一站式數(shù)據(jù)服務(wù)的景聯(lián)文,在這輪新基建中,將作為基建力量,默默支撐著人工智能產(chǎn)業(yè)邁向新的高地。
來 源: 經(jīng)理人
編 輯:liuy