汕頭建設(shè)局網(wǎng)站國(guó)家新聞最新消息今天
🦉 AI新聞
🚀 Meta開(kāi)源生成式AI工具AudioCraft,幫助用戶創(chuàng)作音樂(lè)和音頻
摘要:美國(guó)公司Meta開(kāi)源了一款名為AudioCraft的生成式AI工具,可以通過(guò)文本提示生成音樂(lè)和音頻。該工具包含三個(gè)核心組件:MusicGen用于生成音樂(lè),AudioGen用于生成音頻并擴(kuò)展現(xiàn)有音頻,EnCodec用于音頻壓縮解碼。開(kāi)源后,研究人員和從業(yè)人員可以使用自己的數(shù)據(jù)集訓(xùn)練模型。Meta表示AudioCraft系列模型能夠穩(wěn)定地生成高質(zhì)量音頻,易于使用,可以為音樂(lè)家和聲音設(shè)計(jì)師提供靈感,幫助他們迭代作品。這一消息對(duì)音樂(lè)和聲音領(lǐng)域具有影響力,引起了公眾的興趣,同時(shí)展示了AI在創(chuàng)作領(lǐng)域的新穎性和重要性。
🚀 Meta和OpenAI公司違背開(kāi)源承諾
摘要:荷蘭內(nèi)梅亨大學(xué)的一份研究報(bào)告指出,Meta和OpenAI等公司在使用“開(kāi)源”術(shù)語(yǔ)時(shí)誤導(dǎo)了用戶,他們所標(biāo)記為“開(kāi)源”的大語(yǔ)言模型實(shí)際上并非真正開(kāi)源。具體涉及到Meta的Llama 2模型和OpenAI的GPT / codex模型,這些模型的代碼并未向公眾開(kāi)放。研究人員表示,當(dāng)前AI社區(qū)中缺乏開(kāi)源大語(yǔ)言模型已成為突出問(wèn)題。他們呼吁公司發(fā)布更多的開(kāi)源代碼,方便研究人員和開(kāi)發(fā)人員訪問(wèn),進(jìn)一步提升這些模型的性能。這些公司通過(guò)保護(hù)知識(shí)產(chǎn)權(quán)和控制模型使用方式來(lái)保持競(jìng)爭(zhēng)優(yōu)勢(shì),但對(duì)于研究人員和開(kāi)發(fā)人員而言,面對(duì)開(kāi)源大語(yǔ)言模型卻存在天然的弱勢(shì)。Meta公司的Llama 2模型宣稱是“開(kāi)源”,但實(shí)際上透明度很低;OpenAI的ChatGPT模型更為神秘,完全不符合開(kāi)源標(biāo)準(zhǔn)。研究報(bào)告指出這些公司的行為存在諷刺之處,因?yàn)樗鼈兟暦Q允許研究,卻仍將部分項(xiàng)目?jī)?nèi)容封鎖在開(kāi)發(fā)人員和研究人員之外。
🚀 谷歌旗下YouTube正在測(cè)試AI生成視頻摘要功能
摘要:根據(jù)谷歌支持頁(yè)面的信息,YouTube正在嘗試用人工智能(AI)自動(dòng)生成視頻摘要的功能。這項(xiàng)功能會(huì)在少數(shù)英語(yǔ)視頻旁邊顯示,僅有少數(shù)用戶能夠看到。它們的目的是在不替換視頻作者原有描述的情況下,為用戶提供一個(gè)簡(jiǎn)短的視頻內(nèi)容概覽,幫助用戶決定是否觀看視頻。這是谷歌當(dāng)前進(jìn)行的眾多生成型 AI 項(xiàng)目之一。
🚀 谷歌研究團(tuán)隊(duì)攻破AI-Guardian審核系統(tǒng)的安全防護(hù)措施
摘要:谷歌研究團(tuán)隊(duì)使用OpenAI的GPT-4攻破了AI-Guardian審核系統(tǒng)的安全防護(hù)措施。AI-Guardian是一種能夠檢測(cè)不當(dāng)內(nèi)容的AI審核系統(tǒng),但GPT-4成功欺騙了它的防御機(jī)制,使其精確值大幅降低。雖然相關(guān)技術(shù)文檔已發(fā)布在ArXiv中,但開(kāi)發(fā)者表示這種攻擊方法將在未來(lái)的版本中不再可用。
🚀 Uber開(kāi)發(fā)人工智能聊天機(jī)器人,完善服務(wù)
摘要:據(jù)報(bào)道,網(wǎng)約車(chē)和送貨服務(wù)巨頭Uber正在開(kāi)發(fā)一款人工智能聊天機(jī)器人,并計(jì)劃將其整合到Uber App中,以進(jìn)一步完善其服務(wù)。Uber CEO 達(dá)拉?科斯羅薩西表示,Uber一直在研究機(jī)器學(xué)習(xí)和人工智能系統(tǒng),當(dāng)前,競(jìng)爭(zhēng)對(duì)手DoorDash和Instacart也在開(kāi)發(fā)自己的人工智能聊天機(jī)器人。此舉可能對(duì)Uber提供更高效的配送和服務(wù)有所助益。雖然Uber在第二季度取得了運(yùn)營(yíng)利潤(rùn),但營(yíng)收低于預(yù)期導(dǎo)致股價(jià)下跌。
🚀 阿里云通義聽(tīng)悟升級(jí):新增PPT提取等功能
摘要:阿里云通義聽(tīng)悟升級(jí),新增“提取PPT”、“瀏覽器插件”和“小程序擴(kuò)展”三大功能。通過(guò)視覺(jué)AI算法,自動(dòng)將PPT講解視頻分割為演示文稿,并對(duì)每頁(yè)P(yáng)PT進(jìn)行要點(diǎn)總結(jié),解決了“求PPT難”的問(wèn)題。用戶可以安裝瀏覽器插件進(jìn)行全程錄制并實(shí)時(shí)生成雙語(yǔ)字幕,幫助瀏覽視頻內(nèi)容。此外,通義聽(tīng)悟還增加了釘釘和微信小程序功能,可以一鍵轉(zhuǎn)寫(xiě)手機(jī)和聊天記錄的音視頻文件。通過(guò)引入視覺(jué)AI,通義聽(tīng)悟成為用戶工作學(xué)習(xí)中的AI助手。
🚀 OpenAI推出新一代DALL-E 3 AI模型,引起關(guān)注
摘要:OpenAI正在準(zhǔn)備下一代DALL-E AI模型,已進(jìn)行Alpha測(cè)試。匿名用戶表示,新版測(cè)試版本能生成多種長(zhǎng)寬比的圖像,支持更長(zhǎng)的提示語(yǔ)句,并且具備生成“正常文字”的能力。然而,7月的測(cè)試版本可能生成不適宜內(nèi)容和受版權(quán)保護(hù)的商標(biāo)圖案,對(duì)此OpenAI希望通過(guò)模型層面限制此類(lèi)內(nèi)容的生成。DALL-E 3在圖像質(zhì)量和多樣性上有突破,有望推動(dòng)AI圖像生成進(jìn)入新階段。Stable Diffusion XL 1.0的正式版已推出,OpenAI的DALL-E模型將與之進(jìn)行正面挑戰(zhàn)。
🗼 AI知識(shí)
🔥 小白解密ChatGPT大模型訓(xùn)練
大模型初學(xué)者試圖解密ChatGPT等大模型的全流程訓(xùn)練。Let’s 解密!
🔥 DS-Fusion
本教程說(shuō)明如何微調(diào) Llama 2(一個(gè)強(qiáng)大的語(yǔ)言模型)以進(jìn)行對(duì)話概要生成。本教程涵蓋了下載模型、轉(zhuǎn)換為 Hugging Face 格式、運(yùn)行微調(diào) notebook 和對(duì)微調(diào)后的模型進(jìn)行推理等內(nèi)容。本流程需要使用 Huggingface 庫(kù)并需要具有足夠內(nèi)存的 GPU。本教程還提到了即將推出的在自定義數(shù)據(jù)上訓(xùn)練 Llama 2 的相關(guān)教程。
主要問(wèn)題:
-
如何下載和轉(zhuǎn)換 Llama 2 模型?
-
如何對(duì) Llama 2 進(jìn)行微調(diào)以進(jìn)行對(duì)話概要生成?
-
如何使用微調(diào)后的 Llama 2 模型進(jìn)行推理?
更多AI工具,參考Github-AiBard123,國(guó)內(nèi)AiBard123