2020-09-02 20:59:43 來源:中國周刊 作者:侯智勇
自人工智能入選“2017年度中國媒體十大流行語”以來,其已逐步深入應用到醫療、天文、工業基建等各個重大領域。隨著當下各種數據的激增,人工智能在數據采集和標注方面發揮著越來越重要的作用。基于當今社會科學發展的大背景,在“大膽假設、小心求證”的理念下推出“菁準數據”項目,旨在做全國人工智能企業數據優質服務商。
數據采集快速“菁準”,數據質量穩定輸出
當下市場上的數據采集與標注常常出現數據質量參差不齊、數據獲取困難且價格高等多重問題。傳統的解決方案是通過爬蟲手段進行網絡數據采集,將采集下的數據由AI工程師進行標注。其往往導致采集樣本多樣性不足,數據標注成本高,數據標注處理效率低等問題。針對市場痛點,“菁準數據”根據數據采集做出數據集后再對數據進行標注的方式,即通過將數據進行有效拆分,在達到省時省力省錢的同時,有效保證數據產量、質量的穩定輸出。
其中在數據采集方面,主要采用網頁數據采集系統,打造線上自動化的數據采集器,可視化操作,一鍵自動采集,從而能夠大面積解決網絡數據抓取問題。同時利用數據采集小程序,基于圖片相似度算法(感知哈希算法),基于RNN神經網絡的音頻降噪算法等用于不同場景的圖像、語音等數據采集,方便快捷,可快速大量完成一般性數據采集任務。除此之外,又以圍繞高校密集型人群場所為核心,建立“采集小站”的模式完成較高難度的定制化數據采集任務。計劃初期以實際項目為合作入口逐漸積累不同行業資源,最終實現全行業覆蓋,以構建“行業”到“AI”雙向互贏的橋梁策略,完成行業內數據采集任務。
在數據標注方面,充分發揮眾包模式的優勢,讓用戶可以在數據標注平臺快速、低成本地完成數據標注任務,發展初期在保證數據產量質量穩定輸出的同時,可以全周期完成高難度的標注任務。
線上與線下營銷結合,打造營銷方式多樣化
“精準數據”的推廣主要通過線上營銷與線下營銷相結合的模式,在打造營銷模式多樣化的同時擴大其品牌影響力。其中線上營銷主要通過“官微+微信公眾號”的模式,專業媒體如網易新聞、頭條新聞等,另外通過百度推廣等多種線上營銷媒介來擴大影響力。同時結合線下營銷,如與AI垂直領域國際孵化器建立合作,實現“菁準營銷”,組織各類AI論壇沙龍,商務上門拜訪,與AI企業進行面對面商談,參加展會擴大品牌知名度等等,在擴大知名度的同時及時了解行業信息。
智能語音切入為主,拓展消費目標領域
目前“精準數據”主要以智能語音企業為主要切入口,同時拓展至金融、教育、醫療、家庭家居、無人駕駛、內容審核等眾多領域。主要根據項目需求,專門為企業獨家定制數據方案,關于公司所自營的數據集,企業客戶可購買該數據的共享使用權,同時也可以買斷數據版權。截至目前向巳科技已與國內第一大語音商科大訊飛、國內第二大語音商思必馳、網易網絡有限公司等多家知名企業進行合作。
關于企業未來的規劃,核心團隊人員表示預計2020年資金流水將達到2600萬,公司目前的運營基地主要分布在成都、海南和云南,屆時將完成全國20處運營基地的布局,并進行眾包平臺AI化研發,通過高新企業雛鷹企業認定等。未來,“菁準數據”將繼續利用人工智能創造數據倉庫的智能搬運工。(鄭應松)
編輯:楊文博