最美情侣中文字幕电影,在线麻豆精品传媒,在线网站高清黄,久久黄色视频

歡迎光臨散文網(wǎng) 會員登陸 & 注冊

前商湯科技副總裁創(chuàng)AI大模型企業(yè)MiniMax,首款產(chǎn)品用戶達數(shù)百萬

2023-02-17 20:08 作者:海評  | 我要投稿



在ChatGPT爆火之后,“AI大模型”成為下一個人工智能的高地。

「甲子光年」獨家獲悉,前商湯科技副總裁、通用智能技術負責人閆俊杰已進軍多模態(tài)AI大模型領域,于2021年11月成立人工智能公司MiniMax。2022年上半年,明勢資本領投了MiniMax的天使輪融資。

成立至今,MiniMax是一家頗為神秘的公司,創(chuàng)始人及核心技術團隊人員均未對外公開。

2月16日下午,MiniMax在北京舉行了首場小型媒體溝通會。會上,MiniMax的技術合伙人楊斌公布了公司技術路徑與商業(yè)路徑。

MiniMax從底層做起,形成了文本到視覺(text to visual)、文本到語音(text to audio)、文本到文本(text to text)三大模態(tài)的基礎模型架構,可能是國內(nèi)第一家同時擁有3個模態(tài)大模型能力的創(chuàng)業(yè)公司。

MiniMax的商業(yè)模式與OpenAI相似,包括to C與to B兩大方向。在to C方向,其首款AI虛擬聊天社交軟件Glow推出四個月已經(jīng)積累數(shù)百萬用戶;在to B方向,MiniMax計劃在今年對外開放API。

在ChatGPT的火爆下,AI大模型已經(jīng)成為創(chuàng)業(yè)熱點。此前,前美團聯(lián)合創(chuàng)始人王慧文、出門問問CEO李志飛等人已經(jīng)宣布在該領域創(chuàng)業(yè)。

噪聲越是喧囂,越難以發(fā)現(xiàn)水面下的變化。而MiniMax已經(jīng)在潮水來臨前,提前出發(fā)。

1.核心團隊來自知名高校與科技公司

據(jù)「甲子光年」了解,MiniMax聯(lián)合創(chuàng)始人為前商湯科技副總裁、通用智能技術負責人閆俊杰,也曾擔任商湯研究院副院長。

閆俊杰于2015年博士畢業(yè)于中科院自動化所,此前在商湯科技負責搭建深度學習的工具鏈和底層算法,以及通用智能的技術發(fā)展。此外,他還搭建了商湯的人臉識別和智慧城市相關的技術體系。

在深度學習和計算機視覺領域,閆俊杰發(fā)表頂級會議和期刊論文100余篇, Google Scholar引用超過10000次。

關于通用人工智能,閆俊杰曾表示,應給予算法、算力和系統(tǒng)的協(xié)同創(chuàng)新,推動人工智能通用模型的性能指數(shù)級上升。

MiniMax技術合伙人楊斌曾于2014年在中科院自動化所讀碩士,在加拿大讀完博士后,先后在Uber AI研究院、以及自動駕駛卡車領域有多年研發(fā)經(jīng)驗,對基于數(shù)據(jù)驅動的端到端無人卡車運輸問題頗有研究。

目前,MiniMax團隊人數(shù)已過百,公司核心技術研發(fā)成員均來自全球知名高校和全球頂尖科技公司,擁有世界頂尖自然語言處理,語音,計算機視覺,計算機圖形學等工業(yè)界和學術界經(jīng)驗,擁有多項全球領先的人工智能領域研究成果,具有上百個全球發(fā)明專利,1/3 的團隊成員擁有世界頂尖技術實驗室的博士學位。

在MiniMax創(chuàng)始團隊看來,此次ChatGPT的出現(xiàn)并不意外,但比他們的預期要早3~6個月。

楊斌表示,過去三年,AI領域出現(xiàn)了三個關鍵事件:

第一件是2020年6月,OpenAI發(fā)布GPT-3。這表明在自然語言任務上,也存在類似“摩爾定律”的規(guī)律,即如果讓模型的參數(shù)量成指數(shù)級增加,并配合足夠多的語料數(shù)據(jù),就會發(fā)生化學反應——GPT-3擁有了對自然語言的推理能力,并擁有很好的泛化能力,幾乎能夠解決任何文本處理任務,如翻譯、續(xù)寫、評價等。

第二件是2021年1月,OpenAI的DALL-E-2火出圈,它能夠通過用戶給的一段文字描述生成圖片。DALL-E-2背后是CLIP模型,該模型能夠在互聯(lián)網(wǎng)上抓取大量圖片文本,學習一段時間過后,CLIP能夠實現(xiàn)用自然語言解釋對圖片的理解,也能通過文字描述來生成圖片,這便是一種跨模態(tài)的生成和轉換。

第三件事是2021年8月,特斯拉在AI Day上證明了完全由數(shù)據(jù)驅動的、端到端的深度學習技術棧能夠在自動駕駛上被成功應用,并且已經(jīng)成功上車,在現(xiàn)實世界跑通了數(shù)據(jù)閉環(huán)。此后,全球各大自動駕駛公司才相信這件事原來能夠做成。

基于以上三件事,MiniMax初創(chuàng)團隊早在兩三年前就對未來趨勢做出判斷:AI技術將在未來2-3年內(nèi)發(fā)生質(zhì)的升級,基于這種技術升級,AGI(通用人工智能)將成為可能。

基于對AGI趨勢的判斷,以“和用戶共同創(chuàng)造通用智能 Intelligence with Everyone”為使命的MiniMax,在2021年11月成立。

2.首家“三模態(tài)AI大模型”創(chuàng)業(yè)公司

楊斌認為,人工智能的發(fā)展分為兩個階段。

當下絕大多數(shù)人工智能公司處在AI 1.0階段,通過上萬個單一任務模型,為大客戶(企業(yè)或者政府)提供全套AI解決方案,以此來實現(xiàn)“AI for everyone”。為了定制成千上萬的模型,AI公司需要配備一個人數(shù)龐大的團隊。

而到了AI 2.0階段,AI公司可以利用一個“AI通用大模型”,直接服務于每一個人,就像現(xiàn)在的ChatGPT一樣,實現(xiàn)“AI with everyone”。這僅需要一個規(guī)模較小的團隊就能實現(xiàn),比如OpenAI的人數(shù)也只不過375人(截至2023年1月)。

MiniMax就是要 2.0階段的公司,即通過AI大模型逐漸實現(xiàn)AGI。

在過去的15個月中,MiniMax主要做了兩件事:定義核心技術與商業(yè)路徑。

在技術層面,和目前很多創(chuàng)業(yè)公司只做應用層產(chǎn)品不同,MiniMax直接從底層的基礎模型做起,百分之百自研了三個foundation model(基礎模型)。

MiniMax自研的三個基礎模型為——文本到視覺(text to visual)、 文本到語音(text to audio),文本到文本(text to text)。楊斌表示,MiniMax可能是國內(nèi)第一家同時擁有3個模態(tài)大模型能力的創(chuàng)業(yè)公司。

MiniMax是在Transformer的基礎上做自研,楊斌對此解釋道:“Transformer就像是磚頭,而模型是房子。當然也會參考別人已經(jīng)造好的房子架構,但把自己的房子蓋好需要完全憑借自己的系統(tǒng)工程能力?!?/span>

對于訓練模型所需要的算力、數(shù)據(jù)來源、模型參數(shù)以及訓練成本,MiniMax暫未透露。

在商業(yè)層面,MiniMax可能是國內(nèi)第一個跑通了基于大模型和用戶反饋的公司。

在三個基礎模型之上有一個計算推理平臺,將三個基礎大模型的能力以一種低成本、高魯棒性的方式釋放給用戶。

目前,基于該推理平臺MiniMax在去年11月推出了第一款to C的用戶產(chǎn)品Glow。通過內(nèi)容生成與用戶反饋這樣一種“user-in-the-loop”的方式,來不斷迭代基礎大模型的AI能力,就像ChatGPT引入的人類反饋強化學習機制(RLHF)那樣。

基于AI大模型,MiniMax未來還會有更多的產(chǎn)品產(chǎn)生。

楊斌表示,MiniMax的初心是實現(xiàn)通用人工智能,而這必須要靠一個開放的生態(tài)。所以從今年開始,MiniMax會逐步開放API,讓更多的個人用戶和企業(yè)用戶基于大模型構建自己的應用。

MiniMax的商業(yè)落地模式與OpenAI相似。2020年,OpenAI在完成GPT-3模型的早期測試之后進行了商業(yè)化,向付費用戶與企業(yè)開放API,AI 獨角獸Jasper.ai就是OpenAI的客戶;而ChatGPT則是在GPT-3的基礎上構建的直接面向用戶的聊天機器人應用。

ChatGPT向更多的人普及了AI大模型的概念。而MiniMax已經(jīng)在AI大模型的道路上布局了15個月,無論是從技術上還是商業(yè)落地上,都在創(chuàng)業(yè)公司中走在了前列。

大模型的研發(fā)需要非常高的投入。MiniMax目前并未披露融資信息,但其在招聘網(wǎng)站表示,“MiniMax由全球頂級投資機構背書,是目前全球該領域成長最快的準獨角獸”。

根據(jù)明勢資本官方消息,2022年上半年,明勢資本領投了MiniMax的天使輪融資。

3.創(chuàng)業(yè)是最好的方式,高校、開源、大廠都有局限

創(chuàng)業(yè)公司做大模型,是更難還是更簡單?對此,楊斌也分享了他的思考。

首先,為什么要做文本、語言、視覺三模態(tài)?因為目前我們能消費到的幾乎所有數(shù)字內(nèi)容都是這三模態(tài)的組合排列,包含圖片、小說、視頻等。只要能做好這三個模態(tài)的基礎大模型,就能提供非常好的內(nèi)容生成能力。

楊斌表示,在組織架構層面,為了做好三個大模型的研發(fā),其實并不需要像現(xiàn)在的公司一樣,有成千上萬個研究員、工程師,每個人都做流水線上的小螺絲釘。由于三個模態(tài)不分家,其實只需要一個非常小的團隊,來共同維護優(yōu)化這三個大模型,以及做好用戶閉環(huán)就可以了。

目前MiniMax的團隊人數(shù)在100人左右。

楊斌也談到了對于大模型的制勝點:大模型的系統(tǒng)優(yōu)化,只有以創(chuàng)業(yè)公司的方式才能實現(xiàn)最高的效率。

楊斌認為,如果在高校做,資源會太少;如果用開源的方式做,因為開源本質(zhì)上是在做局部優(yōu)化,開源只適合小模塊、一個齒輪,而MiniMax要做的復雜系統(tǒng)需要集中量來做系統(tǒng)性的全局優(yōu)化,開源也行不通。

如果是大廠來做,也不一定行得通,因為大廠有之前的商業(yè)包袱或者技術包袱,這勢必會在優(yōu)化最終目標的時候產(chǎn)生一些不必要的累贅。

谷歌就是一個很好的案例。雖然谷歌內(nèi)部也有比肩OpenAI GPT模型的對話應用語言模型LaMDA,但直到現(xiàn)在谷歌仍不愿向公眾發(fā)布LaMDA。谷歌完全有能力拿出類似ChatGPT的成果,但一旦出了紕漏,無疑需要承擔更高的經(jīng)濟、聲譽成本。近期谷歌為了對抗微軟匆忙發(fā)布的聊天機器人Bard就證實了這一點。

因此,MiniMax團隊最終決定既然要做,就從最可能選擇把這件事發(fā)揮到極致的路徑,也就是從頭開始創(chuàng)立一家創(chuàng)業(yè)公司。

4.首款產(chǎn)品Glow用戶數(shù)破百萬

Glow是MiniMax首款C端產(chǎn)品,和ChatGPT百科全書一樣的回答不同,Glow的定位在AI虛擬聊天社交軟件,主打聊天、陪伴等情感功能。

Glow的基本玩法是在應用中創(chuàng)建“智能體”——即虛擬AI機器人,可以根據(jù)用戶意愿賦予其性格,實現(xiàn)實時溝通、互動并建立情感連接。

用戶可選擇公開智能體,其他用戶均可和智能體對話;也可選擇不公開,創(chuàng)建自己的專屬智能體。此外,用戶還能夠在搜索框內(nèi)用關鍵詞搜索有相應特征的智能體來對話。


用戶和智能體的每一次對話都會成為對智能體的一次訓練,智能體會根據(jù)用戶對話的引導,對同一問題回復不同答案。


在“話題”功能中,用戶可以創(chuàng)建自己感興趣的話題,還可選擇關聯(lián)自己創(chuàng)建的相關智能體,以便其他用戶在該話題下與智能體對話時有更好的對話體驗。

Glow還有“記憶簿”功能,能夠將用戶與智能體的對話封存,在用戶需要時調(diào)取特定時間的對話內(nèi)容。

目前來看,Glow的文本理解與生成能力更強,在對話過程中,智能體還不會回復表情包,但偶爾會跳出一個emoji。


對此,楊斌表示,現(xiàn)在技術上已經(jīng)能夠通過一定設置讓智能體發(fā)送圖片,但這種方式略顯生硬,有好的解決方案后會進一步改善。

整體來看,和Glow智能體的對話體驗較為流暢,且表現(xiàn)出更強的人格性,會給用戶帶來很強的陪伴感。此外,在對話過程中,涉及“中國”“國家”等詞匯,會被判定為敏感詞,而無法發(fā)送。

Glow現(xiàn)已上線四個月,注冊用戶數(shù)量達數(shù)百萬。

AI大模型的商業(yè)落地仍然處在早期,MiniMax已經(jīng)憑借先發(fā)優(yōu)勢提前邁出了一步。而從整個行業(yè)來看,這場新的AI競賽可能才剛剛開始。

前商湯科技副總裁創(chuàng)AI大模型企業(yè)MiniMax,首款產(chǎn)品用戶達數(shù)百萬的評論 (共 條)

分享到微博請遵守國家法律
井冈山市| 马公市| 红桥区| 顺昌县| 晋中市| 株洲县| 元谋县| 磴口县| 达日县| 乌海市| 霍林郭勒市| 原阳县| 和田县| 仁寿县| 辉南县| 稻城县| 玛沁县| 饶平县| 大洼县| 拉萨市| 大邑县| 安泽县| 田林县| 永济市| 昌邑市| 嘉兴市| 东方市| 奇台县| 北辰区| 永昌县| 呼伦贝尔市| 塘沽区| 昭通市| 衡阳县| 望谟县| 江油市| 中江县| 壶关县| 奎屯市| 右玉县| 夏邑县|