一周 AI 要點:Apple發(fā)布會有多少AI元素?AI繪圖二維碼引網(wǎng)友驚呼:“真能掃出來!”

在這一周,被稱作 “科技圈春晚” 的蘋果 WWDC 召開,“機器學習”成了當晚多次被提及的名詞。而同樣是在這一周,高考來了,但今年網(wǎng)友們除了聚焦奔赴考場的高三考生外,火起來的 AI 也成了另類焦點的“趕考新生”。
蘋果召開 WWDC23 開發(fā)者大會
多次提及「機器學習」
6 月 5 日深夜,蘋果舉行 WWDC23 主題演講,當然焦點無疑是 3499 美元的 MR 設(shè)備 Vision Pro 驚喜發(fā)布。
但在整場活動中, “機器學習”(Machine Learning) 和 “Transformer 模型” 兩個詞匯貫徹了整晚的主題演講。
硬件:服務(wù)于使用場景
硬件方面,蘋果發(fā)布了最高擁有 192GB 統(tǒng)一內(nèi)存的 M2 Ultra 芯片,還特別強調(diào) “用如此大的統(tǒng)一內(nèi)存可以運行其它 PC 無法承擔機器學習運算,比如用它來跑 Transformer 大模型”,用意明顯。

應(yīng)用層面上,AirPods Pro 還能通過機器學習 “學會” 自動調(diào)整音量,根據(jù)用戶不同時間段的喜好和周圍的環(huán)境來微調(diào)音量體驗。
軟件:主打設(shè)備端機器學習
軟件方面,iOS 17 也因 “機器學習” 增色不少。首先在 “通話 Live Voicemail” 和 iMessage 上,iPhone 將能提供本地即時的語音轉(zhuǎn)錄內(nèi)容。
而鍵盤輸入的 “自動糾正” 借助蘋果芯片的強大運算力,將能做到 “每按下一個鍵,iPhone 就運行一次 Transformer 語言模型”,本地的預(yù)測、學習能力表現(xiàn)不錯。

新增的手記 APP,還能通過本地的機器學習標記出用戶生活中的有趣瞬間,創(chuàng)建個性化的時刻建議,待用戶重新查看它們時發(fā)現(xiàn)新的自己。

我們能從這一場主題演講中實打?qū)嵉亓私馓O果對于 “機器學習” 的做法:將一切隱私相關(guān)的模型落實到設(shè)備本地運行,追求機器學習的高效、實用性。
這也展示出了蘋果對于機器學習、乃至于 AI 發(fā)展的明確態(tài)度:這些技術(shù)應(yīng)該服務(wù)于人類,應(yīng)該尊重隱私。
Midjourney v6 版本當前開發(fā)受阻
預(yù)期發(fā)布時間再后延

6 月 7 日,Midjourney 在官方 Discord 頻道召開了 “Office Hours” 用戶交流會,回答了用戶的提問、并介紹了他們的近況。

在這場交流會中,Midjourney 開發(fā)團隊坦言當前 v6 的開發(fā)落后于預(yù)期,他們必須對新版本進行重構(gòu)并進行新一輪的訓(xùn)練,這需要他們清理數(shù)據(jù)、尋找更好的數(shù)據(jù)并對其整理,雖然目前重構(gòu)的進展順利,但預(yù)計發(fā)布日期還是會比預(yù)期時間再推遲 1 個月。
而即將到來的 v5.2 版本盡管更新幅度較小,但在 “outpainting”(擴展重繪)上可能會有不錯的表現(xiàn)。
目前團隊正優(yōu)先構(gòu)建獨立于 Discord 的網(wǎng)站和移動端頁面,也可以看出他們希望將服務(wù)延伸到更廣受眾的雄心。
必應(yīng)聊天即將支持第三方瀏覽器
功能正向部分用戶實驗開放
在上周末,有 Reddit 網(wǎng)友展示了必應(yīng)聊天在 Safari 和 Chrome 瀏覽器運行的截圖。


后經(jīng)外媒向微軟廣告和網(wǎng)絡(luò)服務(wù)部門的負責人 Mikhail Parakhin 確認,微軟正嘗試讓必應(yīng)聊天支持除 Edge 外的第三方瀏覽器,目前正進行實驗,將逐步向更多用戶推出。
中國學生打造 ControlNet for QR Code
用 SD 讓二維碼「美如畫」
近日一組非常漂亮的 “二維碼” 引起了 Reddit 網(wǎng)友熱議,說它是 “二維碼”,倒不如說是“二維畫”,本身是幅畫,“掃碼” 功能更是驚喜。人們驚呼:“真的能掃出來!”

這樣的 “二維畫” 被作者稱作 ControlNet for QR Code,就是 Stable Diffusion 用戶們熟知的那類“ControlNet”,這也意味著只要經(jīng)過一些適當?shù)牟僮?,在未來人們可以?AI 生成出一樣漂亮的“二維畫”。

創(chuàng)造出 “二維畫” 的是 倪豪、陳柏宇、王照涵、陳智勇 這 4 位在校大學生,在有了 “用擴散模型生成一個看上去很像一張圖片的二維碼” 的想法后,經(jīng)過長時間的 ControlNet 訓(xùn)練,四位同學用多種 Checkpoint + LoRA + QR Code ControlNet 的組合創(chuàng)作出了這些美麗的可識別二維碼。


目前,他們已經(jīng)把部分紋樣的 LoRA 上傳到了 Civitai,ControlNet for QR Code 的生成模型還在持續(xù)優(yōu)化中,開發(fā)更新、模型發(fā)布、技術(shù)文檔會在未來陸續(xù)公布,感興趣的朋友可以期待一下。
文本生成視頻工具 Gen-2 開啟免費試用
「文生視頻」時代來了

Runway 宣布視頻生成模型 Gen-2 向全體用戶開放,用戶可直接使用提示文字 / 提示圖像來創(chuàng)建、編輯視頻內(nèi)容,并支持瀏覽器、手機 APP 內(nèi)使用。

例如輸入 “洶涌的海浪”(Rough waters),Gen-2 就能生成一小段海浪視頻,效果算是不錯。

Gen-2 免費用戶目前擁有 105 秒的視頻生成額度,支持付費升級視頻時長、分辨率和生成速度。
網(wǎng)上熱議「AI 趕考」
看 AI 寫出怎樣的高考作文
每一年的高考作文都是全網(wǎng)討論焦點,不過今年的主角不只是高三考生,還有 AI 。隨著近幾個月 AI 的流行,人們也在好奇國內(nèi)外的這些 AI 們在高考作文上都能交出怎樣的答卷。
咱們的?好說 AI?也來秀秀它的文筆,文章的最后我們來看看面對全國甲卷的作文題,它會交出怎樣的答卷。
試題內(nèi)容:
閱讀下面的材料,根據(jù)要求寫作。(60 分)
人們因技術(shù)發(fā)展得以更好地掌控時間,但也有人因此成了時間的仆人。
這句話引發(fā)了你怎樣的聯(lián)想與思考?請寫一篇文章。
要求:選準角度,確定立意,明確文體,自擬標題;不要套作,不得抄襲;不得泄露個人信息;不少于 800 字。
