国产欧美日韩国产欧美日,日韩国产欧美激情在线视频,久久久久久久久久久亚洲,手机看片免费的1024

首頁(yè) / 關(guān)於平安 / 品牌資料庫(kù) / 新聞通稿:平安刷新史丹福機(jī)器閱讀理解排行榜SQuAD 2.0 準(zhǔn)確率超越人類平均水平

新聞通稿

平安刷新史丹福機(jī)器閱讀理解排行榜SQuAD 2.0 準(zhǔn)確率超越人類平均水平

時(shí)間:2020-03-27   文章來(lái)源:中國(guó)平安   【字體:       

平安刷新史丹福機(jī)器閱讀理解排行榜SQuAD 2.0  準(zhǔn)確率超越人類平均水平


香港,上海,2020年3月27日-中國(guó)平安保險(xiǎn)(集團(tuán))股份有限公司(以下簡(jiǎn)稱「中國(guó)平安」、「平安」、「集團(tuán)」或「公司」,股票代碼:香港證券交易所2318,上海證券交易所601318)宣佈,平安科技(深圳)有限公司(以下簡(jiǎn)稱「平安科技」)刷新由史丹福大學(xué)舉辦、備受國(guó)際認(rèn)可的機(jī)器閱讀理解測(cè)試(Stanford Question Answering Dataset,SQuAD 2.0),其機(jī)器閱讀理解模型表現(xiàn)超越人類平均水平。此次為平安科技第三度刷新該榜單。

SquAD廣受人工智能行業(yè)認(rèn)可。SQuAD1.1測(cè)試基於逾500篇維基百科的文章,建立超過(guò)10多萬(wàn)條問(wèn)答。SQuAD2.0新增了5萬(wàn)條人手撰寫的問(wèn)題,使測(cè)試更具挑戰(zhàn)性。新增的問(wèn)題與原有的問(wèn)題相似,但在所提供的文章裏並沒(méi)有對(duì)應(yīng)的答案。因此,參賽團(tuán)隊(duì)所提交的機(jī)器閱讀理解模型需要通過(guò)閱讀多篇文章,判斷能否從中找出答案。對(duì)於無(wú)法回答的題目,該模型必須拒答。

在本次測(cè)試中,平安科技所提交的「ALBERT + DAAF + Verifier」混合模型在代表回答跟標(biāo)準(zhǔn)答案完全一致的精準(zhǔn)匹配率(EM)中獲得90.386分,而在代表回答跟標(biāo)準(zhǔn)答案局部吻合的模糊匹配率(F1)中獲得92.777分,兩項(xiàng)成績(jī)均位列全球第一。DAAF(Data Augmentation and Auxiliary Feature)是平安研發(fā)的學(xué)習(xí)框架,在此次測(cè)試中發(fā)揮關(guān)鍵作用。該框架涵蓋前向及後向算法,前向算法可以基於從外部數(shù)據(jù)中吸收數(shù)據(jù),取得效果提升,至於後向算法則可以自動(dòng)篩除對(duì)提升效果構(gòu)成負(fù)面影響的數(shù)據(jù)。 

平安的兩項(xiàng)成績(jī)均優(yōu)於人類平均水平。根據(jù)SQuAD2.0,平安在EM指標(biāo)所取得的90.386分較人類平均水平高3.56個(gè)百分點(diǎn),而在F1指標(biāo)所取得的92.777分則較人類平均水平高3.33個(gè)百分點(diǎn)。

在過(guò)往的SQuAD測(cè)試中,微軟、谷歌、阿里巴巴等團(tuán)隊(duì)輪番奪魁。截至2020年3月27日,平安在SQuAD2.0榮登榜首,上海交通大學(xué)及谷歌緊隨其後,分別位列第二位及第四位。
 

柏乡县| 萨迦县| 长乐市| 金阳县| 宜春市| 阿坝县| 信丰县| 北川| 辽宁省| 原阳县| 兴业县| 罗城| 汾西县| 九江县| 象山县| 徐汇区| 武清区| 定西市| 海林市| 孟连| 盐源县| 临海市| 威宁| 澄迈县| 孝昌县| 东乌珠穆沁旗| 银川市| 襄樊市| 鹿泉市| 和龙市| 基隆市| 南漳县| 博罗县| 思茅市| 乌海市| 洪泽县| 囊谦县| 乌什县| 临泽县| 巴里| 中西区|