Meta發布最大開源AI模型Llama 3.1 英偉達提供定制服務,云伙伴助陣
- 公司介紹
- 2024-07-24
- 9
【新澳门内部资料精准大全】 |
【2024澳门天天开好彩大全】 |
【澳门一肖一码100准免费资料】 |
【2024澳门特马今晚开奖】 |
【2O24澳彩管家婆资料传真】 |
【2024正版资料大全免费】 |
【管家婆一肖-一码-一中一特】 |
【澳门一肖一码必中一肖一码】 |
【2024澳门正版资料免费大全】 |
【澳门王中王100%的资料】 |
【2024澳门天天六开彩免费资料】 |
【澳门今晚必中一肖一码准确9995】 |
【澳门资料大全正版资料2024年免费】 |
【澳门一码一肖一特一中2024】 |
【澳门管家婆一肖一码100精准】 |
【494949澳门今晚开什么】 |
【2024一肖一码100精准大全】 |
【2024澳门今天晚上开什么生肖】 |
【新澳门精准资料大全管家婆料】 |
來源:硬AI
Meta美東時間周二發布最新款AI模型Llama 3.1 405B,將矛頭對準OpenAI和谷歌公司開發的大模型。扎克伯格稱其為“藝術的起點”,表示Llama 3.1擁有大范圍新的能力,包括改善推理以幫助處理復雜的數學問題、或即時合成一整本書,這是Meta迄今為止最大的模型。同時,英偉達AI Foundry將為全球企業提供Llama 3.1模型的定制服務。
對標GPT4-o、Claude 3.5 Sonnet
媒體報道,Llama 3.1 405B模型包含4050億個參數,是近年來參數規模最大的模型之一。通常,參數大致對應于模型的解決問題的能力,參數越多的模型通常表現越好。該模型使用16000個英偉達H100 GPU進行訓練,受益于新的訓練和開發技術,Meta聲稱,Llama 3.1 405B在一定程度上可以與OpenAI的GPT-4o和Anthropic的Claude 3.5 Sonnet競爭。
Meta高管表示,該模型主要用于為Meta內部和外部開發人員的聊天機器人提供支持,具備廣泛的新功能,包括改進的推理能力,幫助解決復雜的數學問題或瞬間綜合整本書的文本。它還具有生成式AI功能,可以通過文本提示生成圖像。一項名為“想象自己”的功能允許用戶上傳他們的面部圖像,然后生成他們在不同場景和情境中的描繪。
與Meta之前的模型一樣,Llama 3.1 405B可以下載或在云平臺(如AWS、Azure和Google Cloud)上使用。它還在WhatsApp和Meta.ai上使用,為美國用戶提供聊天機器人體驗。
扎克伯格表示,Meta的聊天機器人擁有“數億”用戶,并預計到年底將成為世界上使用最廣泛的聊天機器人。他希望Meta以外的公司也能使用Llama來訓練他們自己的AI模型。
Meta在AI上的投資非常大。扎克伯格表示,訓練Meta的Llama 3模型花費了“數億美元”的計算資源,但他預計未來的模型成本將更高。“未來這將需要數十億甚至更多的計算資源,”他說。2023年,Meta試圖削減一些未來技術和管理層的支出,裁掉了數千個工作崗位,這是扎克伯格稱之為“效率之年”的一部分。但扎克伯格仍然愿意在AI競賽中投入資金。
“我認為現在很多公司都在過度建設,你回頭看時可能會覺得‘哦,我們可能都花費了更多的數十億美元’,”扎克伯格說。“另一方面,我實際上認為所有投資的公司都在做出理性的決定,因為如果落后了,未來10到15年你將在最重要的技術上處于劣勢。”
“如果AI在未來像移動平臺一樣重要,那么我不想通過競爭對手訪問AI,”扎克伯格說,他長期以來對Meta依賴于Google和蘋果手機和操作系統來分發其社交媒體應用感到不滿。“我們是一家技術公司,我們需要不僅在應用層面上構建東西,還要在整個技術棧上進行構建。為此進行這些巨大的投資是值得的。”
目前僅支持文本 將嘗試多模態
像其他開源和閉源生成式AI模型一樣,Llama 3.1 405B可以執行各種任務,可以編程、回答基本數學問題,也可以用八種語言(英語、德語、法語、意大利語、葡萄牙語、印地語、西班牙語和泰語)總結文件。該模型目前僅支持文本操作,這意味著它不能回答圖像問題,但大多數基于文本的工作負載(如分析PDF和電子表格)都在其能力范圍內。
Meta表示,該公司正在嘗試多模態模型。在周二發表的一篇論文中,公司研究人員表示,他們正在積極開發可以識別圖像和視頻并理解(和生成)語音的Llama模型。然而,這些模型尚未準備好公開發布。
為了訓練Llama 3.1 405B,Meta使用了一個包含15萬億個標記的數據集,這些標記的數據更新到2024年(15萬億個標記相當于7500億個單詞)。這不是一個新的訓練集,因為Meta使用了這個基本集來訓練早期的Llama模型,但公司聲稱它改進了數據管理管道,并采用了“更嚴格”的質量保證和數據過濾方法來開發這個模型。
同時,Meta還使用了由其他AI模型生成的合成數據來微調Llama 3.1 405B。目前,包括OpenAI和Anthropic在內的大多數主要AI供應商都在探索合成數據的應用,以擴大AI訓練規模,但一些專家認為合成數據應該作為最后的手段,因為它可能會加劇模型偏見。
在上述論文中,Meta研究人員寫道,與早期的Llama模型相比,Llama 3.1 405B的訓練包含了更多的非英語數據(以提高其在非英語語言上的表現)、更多的“數學數據”和代碼(以提高模型的數學推理能力)以及最近的網絡數據(以增強其對當前事件的了解)。
“在許多方面,訓練數據就像是構建這些模型的秘方和醬料,”Meta AI項目管理副總裁Ragavan Srinivasan在接受TechCrunch采訪時表示。“所以從我們的角度來看,我們在這方面投入了大量資金。這將是我們會繼續精煉的事情之一。”
同時,扎克伯格否認了使用Facebook和Instagram帖子數據訓練Llama是一個關鍵優勢的說法。“這些服務上的許多公共數據我們允許被搜索引擎索引,所以我認為Google等公司實際上也有能力使用很多這些數據。”
更大的上下文窗口和工具
另外,Llama 3.1的上下文窗口(context window)涵蓋128000個標記,比以前的Llama模型更大,大約相當于一本50頁書的長度。
模型的上下文或上下文窗口指的是模型在生成輸出(如文本)之前考慮的輸入數據(如文本)。具有較大上下文窗口的模型,可以總結更長的文本片段和文件。在為聊天機器人提供動力時,這種模型也不太可能忘記最近討論的主題。
Meta周二還推出了另外兩個新的較小模型Llama 3.1 8B和Llama 3.1 70B,這兩款模型是Meta在4月發布的Llama 3 8B和Llama 3 70B模型的更新版本,它們也有128,000個標記的上下文窗口。相比之下,以前的模型上下文窗口最大為8,000個標記。
與Anthropic和OpenAI的競爭模型一樣,所有Llama 3.1模型都可以使用第三方工具、應用程序和API來完成任務。此外,Meta聲稱Llama 3.1模型可以在一定程度上使用某些之前未見過的工具。
建立生態系統
Meta在論文中表示,Llama 3.1 405B的性能與OpenAI的GPT-4相當,在與GPT-4o和Claude 3.5 Sonnet的比較中取得了“混合結果”。盡管Llama 3.1 405B在執行代碼和生成圖表方面優于GPT-4o,但其多語言能力整體較弱,在編程和一般推理方面也落后于Claude 3.5 Sonnet。
由于其規模龐大,它需要強大的硬件來運行。Meta建議至少使用一個服務器節點。Meta表示,Llama 3.1 405B更適合用于模型蒸餾——將大型模型的知識轉移到較小、更高效的模型上——以及生成合成數據來訓練(或微調)其他模型。
為了鼓勵合成數據的使用,Meta表示已經更新了Llama的許可,允許開發者使用Llama 3.1模型系列的輸出來開發第三方AI生成模型。重要的是,該許可仍然限制了開發者如何部署Llama模型:月活用戶超過7億的應用開發者必須向Meta申請特別許可,由公司自行決定是否授予。
除了Llama 3.1系列,Meta還發布了所謂的“參考系統”和新的安全工具,其中一些工具阻止可能導致Llama模型行為不可預測或不理想的提示,以鼓勵開發者在更多地方使用Llama。公司還預覽并征求對Llama Stack的意見,這是一個即將推出的API,用于微調Llama模型、使用Llama生成合成數據以及構建“代理”應用程序——由Llama驅動的可以代表用戶采取行動的應用程序。
爭奪市場份額 正在研發Llama 4
在周二早上發布的一封公開信中,Meta CEO馬克·扎克伯格描繪了一個未來的愿景,即AI工具和模型能夠到達世界各地更多的開發者手中,確保人們能夠享受到AI的“好處和機會”。
扎克伯格既捍衛自己的開源策略,又大規模投資AI。“我認為對于一個AI助手來說,最重要的產品特性將是它的智能程度,”扎克伯格在接受媒體采訪時說道。“我們正在構建的Llama模型是世界上最先進的模型之一。”
扎克伯格補充說,Meta已經在研發Llama 4。
目前,Meta采用了一個久經考驗的策略:免費提供工具以培養生態系統,然后逐漸添加一些付費的產品和服務。在模型上花費數十億美元,然后將其商品化,還可以降低Meta競爭對手的價格,并廣泛傳播公司的AI版本。這也讓公司可以將開源社區的改進納入其未來的模型中。
Llama無疑引起了開發者的注意。Meta聲稱,Llama模型已經被下載了超過3億次,到目前為止已經創建了超過20,000個Llama派生模型。
目前,Meta正在花費數百萬美元游說監管機構接受其偏好的“開放”生成式AI。雖然,Llama 3.1模型并沒有解決當今生成式AI技術的根本問題,如其容易編造內容和重復訓練數據中的問題。但它們確實推進了Meta的一個關鍵目標:成為生成式AI的代名詞。
與英偉達聯手 AI Foundry將提供定制Llama 3.1模型服務
此外,Meta還聯合AI芯片領頭羊英偉達周二宣布,英偉達AI Foundry將為全球企業定制Llama 3.1生成式AI模型,將他們的數據與Llama 3.1 405B和英偉達Nemotron模型結合,創建“超級模型”。
英偉達AI Foundry將提供全面的生成式AI模型服務,涵蓋數據管理、合成數據生成、微調、檢索、安全防護和評估,以部署定制的Llama 3.1 NVIDIA NIM微服務,并提供新的NVIDIA NeMo檢索微服務以實現準確的響應。
Meta是英偉達的頂級客戶之一,由于沒有運行自己的面向企業的云服務,Meta需要最新的芯片來訓練其AI模型,這些模型內部用于目標定位和其他產品。例如,Meta表示,Llama 3.1模型的最大版本是在16,000個Nvidia H100顯卡上訓練的。
分析認為,這種關系對兩家公司來說是各取所需。對于英偉達來說,Meta正在訓練其他公司可以使用和調整的開源模型,而無需支付許可費用或請求許可,這可能會擴大英偉達自身芯片的使用,并保持需求的高漲。
但開源模型的創建可能耗資數億美元或數十億美元。沒有多少公司能夠以類似的投資金額開發和發布這樣的模型。雖然Google和OpenAI是英偉達的客戶,但他們將其最先進的模型保持私有。
另一方面,Meta需要穩定供應的最新GPU來訓練越來越強大的模型。與英偉達一樣,Meta也試圖培養一個以公司開源軟件為中心的AI應用程序開發者生態系統,即使Meta不得不基本上免費提供昂貴的代碼和所謂的AI權重。
媒體報道,埃森哲將是使用新服務為客戶構建定制Llama 3.1模型的首家企業,沙特阿美石油公司、AT&T、Uber和其他行業領袖也成為首批訪問新Llama NVIDIA NIM微服務的用戶。
Meta的25個Llama相關企業合作伙伴包括Amazon Web Services、Google Cloud、Microsoft Azure、Databricks和Dell。
網友:偉大的杰作 開源的勝利
英特爾首先發來賀電:“恭喜MetaAI!我們很激動能用Llama 3.1的發布來優化我們的AI產品組合。”
有網友表示,“非常棒的研究和進步,正在向著開源通用人工智能邁進!”
大部分網友對Meta表示祝賀,認為Llama 3.1是偉大的杰作,是開源社區的勝利。
也有網友質疑,規模如此巨大的模型,運行的時候要耗費多少電能?會對環境造成多大影響?
本文由花米于2024-07-24發表在山東天一水務工程有限公司,如有疑問,請聯系我們。
本文鏈接://realrule.com.cn/post/3660.html
發表評論