最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

新華社研究院給8款國產(chǎn)大模型“深度體檢”,訊飛星火工具效能指數(shù)遙遙領(lǐng)先!

2023-08-14 17:07 作者:科技港口  | 我要投稿

自“十四五”數(shù)字經(jīng)濟發(fā)展規(guī)劃下發(fā)以來,我國高度重視發(fā)展數(shù)字經(jīng)濟,密集出臺頂層戰(zhàn)略規(guī)劃,明確數(shù)據(jù)要素是數(shù)字經(jīng)濟深化發(fā)展的核心引擎,對提高生產(chǎn)效率具有“乘數(shù)效應(yīng)”,要求“政企研用”各環(huán)節(jié)協(xié)同推進新技術(shù)、新模式、新業(yè)態(tài)和制度創(chuàng)新。其中以人工智能為核心的大模型產(chǎn)業(yè)呈現(xiàn)星火燎原之勢,為社會數(shù)字化發(fā)展帶來強勁動力。8月12日,新華社重磅發(fā)布《人工智能大模型體驗報告2.0》,將時下熱門的訊飛星火、百度文心一言、商湯商量、阿里通義千問、智譜AI-ChatGLM、昆侖萬維天工、瀾舟Mchat、360智腦共計八款國產(chǎn)大模型進行橫向測評,結(jié)果訊飛星火以總分第一的成績技壓群“?!?,可以說是成為了現(xiàn)階段國產(chǎn)大模型的“領(lǐng)頭羊”。

此次大模型報告由新華社研究院中國企業(yè)發(fā)展研究中心權(quán)威發(fā)布,歷時一個多月。相比6月首次發(fā)布的《人工智能大模型體驗報告》(1.0版本),在題目設(shè)計、對標(biāo)Benchmark(人類)、打分權(quán)重以及專家測評團隊四大維度進行了全面升級。新版報告將大模型能力拆解為基礎(chǔ)能力、智商評估、情商評估以及工具提效指數(shù)四大維度。除研究院研究員參與深度體驗外,還特邀北京大學(xué)文化與傳播研究所,以及其他業(yè)界、學(xué)界專家參與;通過增設(shè)500道測評題目,對各款大模型的優(yōu)劣特長進行更加全面、客觀的綜合性評估。


從技術(shù)源頭追溯,大模型是數(shù)智化社會的底層基石,可視為“根技術(shù)”之一。在基礎(chǔ)能力上,課題組以語言能力、AI向善、跨模態(tài)和多輪對話四大指標(biāo)進行測評,結(jié)果顯示以訊飛星火、商湯商量、文心一言為代表的五款大模型“越”過了180分的高分紅線。但總體而言,得益于各家大模型持續(xù)性的投入,人類與AI之間的差距并不顯著。

人類作為高等靈長類生物,在漫長的歲月發(fā)展中沉淀了對世界、社會和文化的基本信息認知。而在智商評估中,課題分別從常識知識、邏輯能力和專業(yè)知識等方面對大模型進行考察,結(jié)果訊飛星火與智譜AI-ChatGLM以147分并列第一。它們在處理復(fù)雜問題時能夠提供更嚴謹?shù)乃季S邏輯和更強大的分析決策能力,推動人工智能從認知走向感知。再結(jié)合醫(yī)療、法律等專業(yè)領(lǐng)域的推理能力,有助于在特定領(lǐng)域中進行更準確與高效的問題處理。

作為數(shù)字時代的新生產(chǎn)力工具,大模型能否幫助人類工作提質(zhì)增效成為重點考量范疇。報告顯示,訊飛星火提供了更為豐富、有效的工具,包括代碼生成、數(shù)據(jù)自動分析和可視化工具、文件整理等,足以幫助人類更快、更從容地完成工作任務(wù)。同時訊飛星火能夠提供新的思路和方法,推動業(yè)務(wù)流程、選題創(chuàng)新和內(nèi)容創(chuàng)新等工作方式的改進和升級。在該項評估中,訊飛星火以350分大比分領(lǐng)先于其他大模型,與第二名都拉開了15分的巨大差距。

作為人工智能的國家隊,科大訊飛背靠認知智能國家重點實驗室,加速了大模型的持續(xù)研發(fā)和創(chuàng)新迭代。比如在今年NeurIPS 2022教育因果挑戰(zhàn)賽中,認知智能國家重點實驗室以顯著優(yōu)勢奪得真實場景教學(xué)效果推斷賽道冠軍,創(chuàng)新性提出了基于學(xué)習(xí)過程一致性知識追蹤的教學(xué)效果推理模型,并在科大訊飛AI學(xué)習(xí)機中實現(xiàn)了規(guī)?;涞兀屒把丶夹g(shù)走出實驗室,在廣闊市場真正有了“用武之地”。

據(jù)悉,科大訊飛將在15日舉辦星火V2.0升級發(fā)布會,屆時不僅會帶來代碼能力的突破,更將進一步面向客戶提供業(yè)界領(lǐng)先的私有化代碼能力平臺,讓大模型在重點領(lǐng)域、關(guān)鍵環(huán)節(jié)實現(xiàn)全棧式自主可控。


新華社研究院給8款國產(chǎn)大模型“深度體檢”,訊飛星火工具效能指數(shù)遙遙領(lǐng)先!的評論 (共 條)

分享到微博請遵守國家法律
富顺县| 萨迦县| 小金县| 清水河县| 河东区| 凉城县| 靖边县| 三原县| 陇西县| 鄂托克前旗| 城固县| 思南县| 伊川县| 甘南县| 寻甸| 保定市| 区。| 陆丰市| 纳雍县| 郸城县| 襄垣县| 六枝特区| 泉州市| 微博| 会泽县| 湘乡市| 吉林省| 绥棱县| 韶关市| 五寨县| 武鸣县| 岫岩| 宾阳县| 天祝| 丁青县| 扎赉特旗| 廉江市| 华宁县| 九龙坡区| 富阳市| 西华县|