【AI創(chuàng)新周刊】9月4號-9月11號

前沿動態(tài)
AI Agent (自動化智能體)
AGIC藝術(shù)與創(chuàng)意
?? AI健康管理與醫(yī)療
AI超級個體(攻略教程)

跟上人工智能這樣快速發(fā)展的行業(yè)是一項艱巨的任務(wù) ?? 我們從信息海洋中精選值得關(guān)注的 AI 前沿動態(tài)、工具和教程,幫助你更好地工作和生活
?? 希望我們的付出能幫你工作輕松一點,多一點悠閑留給生活
前沿動態(tài)
?? 騰訊發(fā)布混元 LLM
官網(wǎng)申請,或小程序搜索“騰訊混元助手”申請。?? 官網(wǎng):https://hunyuan.tencent.com/
??螞蟻集團(tuán)金融大模型:
功能:提供理財、保險領(lǐng)域的行情分析、資產(chǎn)規(guī)劃、持倉診斷等 ?? https://twitter.com/Meta360DAO/status/1700339299504259445
?? AI公司Imbue完成2億美元B輪融資
專為推理而定制的大型模型,目標(biāo)創(chuàng)建實用AI代理
在一篇blog中提出讓Agent生成并驅(qū)動代碼查找數(shù)據(jù)而不是讓Agent直接查找數(shù)據(jù),這個思路挺好,可能是一個關(guān)注方向 ?? https://twitter.com/Meta360DAO/status/1700338518839505205
?? 阿布扎比技術(shù)創(chuàng)新研究院發(fā)布了Falcon 180B語言模型,聲稱模型質(zhì)量超過了LLaMA 2并且與PaLM 2相當(dāng),僅次于GPT-4。
模型是開源的,可以用于商業(yè)用途
1800億參數(shù)(GPT 3.5是1750億參數(shù)),由3.5 萬億 Tokens 的語料進(jìn)行訓(xùn)練,宣稱能力接近 GPT-4。但是訓(xùn)練語料中只有5%是代碼,代碼能力不強(qiáng),很難說能力接近GPT-4。
在3.5 萬億Token上進(jìn)行訓(xùn)練,總共花費了約 7,000,000 個 GPU 計算時。?? 模型官網(wǎng):https://falconllm.tii.ae/index.html ?? 在線試用:https://huggingface.co/spaces/tiiuae/falcon-180b-demo ?? ?Huggingface上的介紹文章:https://huggingface.co/blog/zh/falcon-180b ?? 基礎(chǔ)模型:https://huggingface.co/tiiuae/falcon-180B ?? Chat模型:https://huggingface.co/tiiuae/falcon-180B-chat
?? 百川智能推出 Baichuan 2 LLM
采用 2.6 萬億 Tokens 的高質(zhì)量語料訓(xùn)練,發(fā)布了 7B、13B 的 Base 和 Chat 版本。
依舊開源,申請后可商用。?? Github:https://github.com/baichuan-inc/Baichuan2
AI Agent (自動化智能體)
?? 幾個AI Agent應(yīng)用案例
?? 清華發(fā)布模擬軟件公司的AI Agent智能體,模擬軟件公司的多個AI角色(首席執(zhí)行官、首席技術(shù)官、程序員、測試員)可協(xié)作完成軟件開發(fā),個性化創(chuàng)建自己的軟件 ?? https://github.com/OpenBMB/ChatDev
?? Open Interpreter
OpenAI 代碼解釋器的開源版本。
我見過的最好的實現(xiàn)它確實有效。
這些工具讓我們了解人工智能驅(qū)動的個人計算會是什么樣子。
?? GitHub:https://github.com/KillianLucas/open-interpreter ?? Video: https://twitter.com/i/status/1699409632396198393
?? Automat 將視頻轉(zhuǎn)變?yōu)楣ぷ髁鞒套詣踊?/p>
?? https://techcrunch.com/2023/09/06/y-combinator-backed-automat-turns-videos-into-workflow-automations/
AGIC藝術(shù)與創(chuàng)意
?? HeyGen視頻翻譯:
一鍵將視頻語音翻譯為其他語言,保持唇型與發(fā)音同步,語音克隆功能
不支持輸出中文語音,但是支持輸入中文語音翻譯成其他語言的語音。??體驗:http://labs.heygen.com/video-translate ?? 效果演示:https://twitter.com/Meta360DAO/status/1700374844188070364
??Suno音樂生成:
文字生成音樂AI模型Suno發(fā)布重大更新:Chirp v1
功能:支持50多種語言、增強(qiáng)音頻質(zhì)量、選擇音樂風(fēng)格、標(biāo)簽控制歌曲結(jié)構(gòu)、更快生成速度 ?? https://twitter.com/xiaohuggg/status/1700133814096498922?s=20
??StockMusic:
類型:人工智能音樂生成工具
特點:支持50多種流派,最長生成120秒的歌曲 ?? https://twitter.com/xiaohuggg/status/1699021507304030581?s=20
?? SmashOrPass.ai:AI 版 Tinder
非常簡單的一個網(wǎng)站,展示AI繪制的人像,你選擇Smash(喜歡)還是Pass(不喜歡),AI根據(jù)你的選擇,持續(xù)優(yōu)化提示詞,從而生成更加符合你喜好的人像。?? 網(wǎng)址:smashorpass.ai
?? SmashOrPass.ai:AI 版 Tinder
非常簡單的一個網(wǎng)站,展示AI繪制的人像,你選擇Smash(喜歡)還是Pass(不喜歡),AI根據(jù)你的選擇,持續(xù)優(yōu)化提示詞,從而生成更加符合你喜好的人像。?? 網(wǎng)址:smashorpass.ai

?? Coqui + Bark 語音克隆更新?
1.您現(xiàn)在可以錄制自己的聲音
2.新角色庫讓您可以使用精心挑選的聲音 ?? https://twitter.com/Meta360DAO/status/1699031032501018660 ?? https://huggingface.co/spaces/fffiloni/instant-TTS-Bark-cloning
?? 一個用蘋果 emoji 訓(xùn)練的 SDXL 模型,可以把想要的內(nèi)容變成 emoji 風(fēng)格。
試著生成了一下川普、拜登、奧巴馬三人組,還挺像的就是成功率有點低。
這個模型不能下載,有想法的可以自己訓(xùn)練一下,感覺有些商機(jī)。?? https://replicate.com/fofr/sdxl-emoji
?? TokenFlow:TokenFlow: 通過固定文本到圖像擴(kuò)散實現(xiàn)一致視頻生成和風(fēng)格化
功能:文本到圖像擴(kuò)散模型進(jìn)行文本驅(qū)動的視頻編輯
特點:根據(jù)文本提示生成新視頻,可以替換背景或人物 ?? 網(wǎng)頁:http://diffusion-tokenflow.github.io ?? 演示:https://huggingface.co/spaces/weizmannscience/tokenflow/ ?? 代碼:https://github.com/omerbt/TokenFlow ?? colab:https://github.com/camenduru/TokenFlow-colab ?? demo: https://twitter.com/i/status/1698759688827847025 ?? 作者: ?https://twitter.com/omerbartal
?? AI健康管理與醫(yī)療
?? 醫(yī)療保健人工智能行業(yè)的硬核成果。微軟剛剛宣布與 Paige ?@paige_ai 合作,構(gòu)建最大的基于圖像的癌癥檢測人工智能模型。
該模型正在對前所未有的數(shù)據(jù)量進(jìn)行訓(xùn)練,消化數(shù)十億張圖像以識別常見和罕見的癌癥。
Paige 最初是紀(jì)念斯隆凱特琳癌癥中心的衍生公司,已經(jīng)擁有一個人工智能,可以幫助病理學(xué)家檢測乳腺癌、結(jié)腸癌和前列腺癌。
Paige強(qiáng)調(diào),它是醫(yī)生的工具,而不是替代品。旨在提高超負(fù)荷醫(yī)務(wù)人員的速度和準(zhǔn)確性。人工智能可能會徹底改變?nèi)蛎磕陻?shù)百萬與癌癥作斗爭的人的檢測和護(hù)理。?? https://twitter.com/Meta360DAO/status/1700340042336469353
?? PMC-LLaMA:
描述:開源醫(yī)學(xué)領(lǐng)域語言模型
特點:基于大約480萬篇生物醫(yī)學(xué)學(xué)術(shù)論文微調(diào) ?? ?https://docs.agi360.xyz/web/#/12/11249
?? V7 Labs:一個AI訓(xùn)練數(shù)據(jù)平臺,該平臺能夠自動化視頻和圖像標(biāo)注,提供前所未有的速度和效率,從而訓(xùn)練更好的模型。
他們有一個醫(yī)學(xué)影像AI訓(xùn)練數(shù)據(jù)平臺,廣泛應(yīng)用于CT和MRI掃描分析、牙科圖像分析、皮膚科圖像分析、乳腺X光分析、超聲波分析等多個醫(yī)療用例。-V7 Labs的 "Workflows" 功能會引導(dǎo)你完成從準(zhǔn)備數(shù)據(jù)到最終得到一個可用的 AI 模型的整個過程,而且速度非常快,只需要幾小時即可完成。
該平臺的優(yōu)勢包括:1、安全性:符合GDPR、ISO 27001、SOC2、FDA Part 11和HIPAA等多項安全標(biāo)準(zhǔn)。2、自定義工作流程:V7的工作流程可以幫助您結(jié)構(gòu)化您的ML管道,從上傳數(shù)據(jù)、標(biāo)注和審查,到幾小時內(nèi)訓(xùn)練準(zhǔn)確的AI模型。3、多種標(biāo)注類型:包括對象檢測、實例分割、全景分割、圖像分類等。網(wǎng)站:https://v7labs.com/industry/healthcare ?? https://twitter.com/i/status/1698528079369617529
AI超級個體(攻略教程)
?? 哈佛大學(xué)發(fā)布AI指南:
指南內(nèi)容:如何在教學(xué)中安全、合法、合規(guī)地使用生成式AI工具
提醒:不得將學(xué)生作業(yè)輸入到AI系統(tǒng)內(nèi) ?? (https://twitter.com/xiaohuggg/status/1698938035482865773?s=20)
?? AI 圖像修復(fù)大全:
描述:整合了一系列圖像修復(fù)工具和模型
適用人群:對圖像修復(fù)感興趣的用戶 ?? (https://twitter.com/xiaohuggg/status/1698981381022581104?s=20)
?? AGI360.xyz 專題攻略-提示語工程

?? https://agi360.xyz
支持人類反饋的 GPT-3.5 微調(diào) 一套 GPT-3.5 的微調(diào)教程,支持人類反饋數(shù)據(jù):https://docs.argilla.io/en/latest/guides/llms/examples/fine-tuning-openai-rag-feedback.html
教程:如何訓(xùn)練SDXL Lora 詳見推文:https://twitter.com/fofrAI/status/1691108135749156864 中文版視頻教程:https://www.youtube.com/watch?v=s0XJOGfUxkE
Awesome-LLMOps:https://github.com/tensorchord/Awesome-LLMOps
小而美創(chuàng)新工具包:定位模版