大模型為何不知道“13.8大還是13.11大”?傅盛解析
- 產品中心
- 2024-07-27
- 8
【新澳门内部资料精准大全】 |
【2024澳门天天开好彩大全】 |
【澳门一肖一码100准免费资料】 |
【2024澳门特马今晚开奖】 |
【2O24澳彩管家婆资料传真】 |
【2024正版资料大全免费】 |
【管家婆一肖-一码-一中一特】 |
【澳门一肖一码必中一肖一码】 |
【2024澳门正版资料免费大全】 |
【澳门王中王100%的资料】 |
【2024澳门天天六开彩免费资料】 |
【澳门今晚必中一肖一码准确9995】 |
【澳门资料大全正版资料2024年免费】 |
【澳门一码一肖一特一中2024】 |
【澳门管家婆一肖一码100精准】 |
【494949澳门今晚开什么】 |
【2024一肖一码100精准大全】 |
【2024澳门今天晚上开什么生肖】 |
【新澳门精准资料大全管家婆料】 |
專題:2024中國企業未來之星年會
2024中國企業未來之星年會于7月26日-28日在上海舉行。獵豹移動董事長兼CEO、獵戶星空董事長傅盛出席并演講。
傅盛表示,很多人問將TikTok原型賣給張一鳴后不后悔,“沒有什么后悔的,因為我們沒有這個基因,字節就是做得好”。他認為,“如果(我們)自己做,肯定不如今天TikTok做得好。每個人、每個團隊都有自己的能力圈”。
談起今日火爆的大模型無法正確解答“13.8大還是13.11大”的原因,傅盛解釋說,這是大模型的缺陷之一,因為大模型僅是字符串的學習。“大模型的幻覺和一本正經的胡說八道,它不知道自己不知道,人說錯話,馬上就知道,但大語言模型不是,它一本正經的講林黛玉打虎的故事,講得活靈活現,它沒有反思能力”。
以下為演講實錄:
傅盛:我想說有時候歸不歸零,不是你說了算,而市場說了算。
有一次我寫了一個PPT給張一鳴看,我說有時候是被逼的,有時候是有遠大的理想,張一鳴看了以后說都是被迫,哪有什么遠大的理想。科技浪潮席卷而來,我們必須要不斷跟進。
2010年開始創業,我們創立了獵豹移動。經歷了三個時段,第一個時段把金山毒霸工業軟件變成了企業軟件,現在還有營收,同一期的軟件都沒有了,金山毒霸還有營收。第二個時段,我們發現中國的APP紅利沒有了,到了全球6億閱讀活躍用戶,其中4億來自海外,TikTok也是我們天使投資,后來賣了頭條。
之后我們想找一個大的風口,16年我們看到了AI,當時我們都認為可以快速改變人類,可以快速做AI。但有時候技術不是一直高歌猛進,有高潮期,也有低谷期,終于等來了ChatGPT,模型就應該以AI為核心,所以我們的slogan:AGI時代成為全球領先的新質生產力工具提供商。
很多人問我賣掉TikTok(原型)會不會后悔,沒有什么后悔,因為我們沒有這個基因,字節就是做得好。如果自己做,肯定不如今天TikTok做得好。每個人、每個團隊都有自己的能力圈,最早我開始打造360安全衛士,到后面選擇工具,就是因為我們的基因,我們團隊就是做工具,能把工具做好不錯了。
我大致講一下AI很熱,很多人都知道,我還是做點科普。如果再做幾十年回頭看這一波AI浪潮,可能和前面看牛頓和愛因斯坦一樣。前段時間我去拜訪羅振宇,很多企業家都是這樣,現在的環境下如何創業,羅振宇說就是兩件事:第一,真正追求快速閉環,一個擺攤的哪怕出現很大的變化,也有自己的小循環;第二,做一些穿越周期的事,愛因斯坦1905年的四篇論文,“相對論”奠定了現在的信息技術基礎,2023年我們認為ChatGPT的出現,會改變人類社會的方方面面。最近阿里巴巴的王堅說AI也會改變科研,以前科研是假設性科研,就是我們看到很多現象做一個公式的假設,但以后科研就是端到端的科研、數據類的科研、直接給出結論的科研。
為什么這次的AI和16年看到的AI不一樣呢?因為那時候看到AI很激動,覺得計算機可以識圖、認人臉,就覺得它可以做一切。今天看起來識別并不是人類獨有的技能,識別是一種感知,狗也認識你,語言才是人獨有的技能,尤其是推理的語言。今天看起來能夠突破語義理解就是人工智能的重大突破,在ChatGPT出來之前,行業都認為語義理解不知道什么時候會實現。
ChatGPT之所以牛,就是因為它改變了學習路線,之前的大部分路線是讓計算機學規則,就是學定、狀、主。但是OpenAI相信只要給它足夠多的語言數據,OpenAI就會像小孩一樣突然有一天開口說話,就會理解語言。在此之前,大家都沒有那么相信,所以其實在GPT3.0出現之前,OpenAI在硅谷都不被看好。所以,ChatGPT不是技術的勝利,而是技術信仰的勝利。
因為人工智能就像大樹下,Transformer都是一樣的。像Google、百度這樣的大公司,他們覺得智能可以通過規則以及語言的理解才能完成,但OpenAI相信只要做好下一次預測就能產生智能。這條路線非常艱難,艱難在于并不知道它的核心原理,但必須堅信,要不斷的試。它最難的是每次試都要花幾千萬美金,再去試,試完之后再調整。今天“百模大戰”不是技術的難度,而是技術信仰的難度,真的敢于相信、敢于投錢,才能真的把ChatGPT做出來。
今天有很多文章說它產生意識,說它替代人類,都不用相信它,ChatGPT就是預測下一個詞的計算機,不斷預測下一次就產生了智能。前首席科學家真的很厲害,他認為只要給足夠多的數據,計算機就會預測下一個詞,通過不斷的預測就可以產生智能,通過不斷的預測就可以完成整體的涌現。他做了類比,一本偵探小說兩三百頁,翻到最后一頁說殺手是誰的時候,如果腦子里出現了這個人的名字,正好就是這個殺手,說明你讀懂了這本小說。因為每一個下一個詞的涌現都是對前面所有文章的理解。
還有一點,為什么能出現這樣的智能,它的原理還屬于黑盒,就是沒有數學公式推導能證明會出現這樣的智能。我們這個行業有一個俗語,每次訓練大模型就像煉丹,開始煉的時候不知道效果怎么樣,一定要最后結果出來才持續。
為什么OpenAI很厲害呢?16年我們開始做語音識別、視覺識別的時候,隨著數據量的增加,以前系統的智能水平很快就上來了,但是它只能上到一定的水平,這次給了大量的數據,它一直不怎么樣,突然有一天(這是一個形象的比喻)某一個時刻,水平一下子就起來了,到了原來系統到不了的智能化水平。各大模型都是這樣,基本上訓前兩個月看這個模型的水平很一般,到第三個月就起來了,就是這樣的標準。所以我說是技術信仰。
因為技術信仰,今天我們也認為OpenAI的道路也不是唯一正確的,未必是唯一正確的。因為技術有意思就在于它不斷的分支,不斷產生新的可能性,當OpenAI在大參數模型上一騎絕塵的時候,越來越多的小參數模型開源社區開始出現。大家認為既然這條道路上可以產生智能,那用更少的參數能否產生智能,所以看科技的本質就是不斷think? difference的過程,正是不斷的think difference才能有更多的創新。
即便是OpenAI如此大的公司,超牛的公司也要造一個愛因斯坦,造出一個愛因斯坦全世界都解決了所有的問題。但是也有一幫人沒有那么有錢,技術沒有那么強,能不能做一個平民化的模型,只要解決專門的問題就行了,今天開源陣營就是在做這件事,用更便宜的算力成本、更小的參數量在某一個領域實現更好的效果,最近微軟、蘋果發了,去年我們就有這樣的判斷,認為一定會出現這樣的分支,所以我們堅定都在開源陣營的道路上。
去年我和朱嘯虎有一次吵架,做AI到底是應用重要還是模型重要?當時由于大模型出來,他震驚了,很多人都認為大模型會占據99%的產業鏈價值,但當時我就說應用是核心。今年世界人工智能大會,幾乎每個大佬都在談應用,大家終于意識到給一個聊天窗口,給一個用戶,就可以解決他生活中的所有問題,這件事情不可能,只有結合實際的需求,足夠多的應用,才能讓大模型人工智能為更多用戶所用。
前兩天美國蘋果發布的iOS?18,股價漲了10%,漲出了一個茅臺和騰訊,這是蘋果歷史上第一次沒有發布任何的硬件產品,而是發布一個概念,就是因為把Siri的概念重新包裝了一遍,不能用“包裝”,才失敬了,就是重新升級了一下,它就變成了你的助理,它用GPT技術做了交互。交互革命和生產力革命,毋庸置疑了,歷史上機器人都在圍繞人轉,所有的終端都會被重新改造一遍。未來siri就是我們和手機最重要的交互窗口,未來siri通過它對你的預測就可以完成,蘋果的展示里就有,siri說:明天你媽媽要求來機場了,記得去接她。這是助理的方式,以前是很難想象的。
生產力革命是第一次把電能轉化為通用智能,人工智能引發全世界、全社會特別關注的核心。雖然以前我們有很多智能系統,但每個智能系統都要做開發、做適配,所以它并不能實現邊際成本趨近于零,這次是可以實現的。
三星也發了一款手機。
推薦大家用一下meta搜索,搜一下就是一份報告。這兩天ChatGPT推出了自己的社區GPT,搜索就是一個強應用。因為以前搜索要搜幾十個網頁,把內容整理出來。像Meta這樣的產品,就可以把網絡調出來,整理為一份報告,把需要一個晚上時間整理的報告變成了2分鐘,搜索一定是重要的革命。
還有就是Copilot推出的SHC,它沒有用英特爾的芯片,而是高通的芯片,高通的芯片是有45Flops的GPU,它可以獨立處理AI的各種運算,有可能你對電腦說今天晚上把哪些文章搜一遍,整理出哪些東西,你走了,它就在工作。以前計算機也是一個生產力工作,但必須人伴隨它,以后就是把計算機一放,它就把該做的做了。
我們講講自己的應用。講了AI這么多強的地方,我要講講行業不行的地方。行業有很多有意思的事,看起來AI非常熱但好的案例幾乎沒有,除了大模型公司自己講,真正在客戶沒有落實好的案例。而且今天很多人都在說我們都在期待一個好的to C應用,好像都沒有出現。
尤其是我們在做企業應用,在做機器人,它有三大阻礙:第一,我們的訓練數據來自互聯網,但互聯網實際上是冰山顯露出在睡眠的一部分,我有個比喻,跟牛頓學力學,是每天和他喝杯咖啡好,還是看他的自然科學的書,當然沒有機會和他每天喝咖啡,書本是批量教育的產物,真正好的知識是深入的詢問。很多知識來自日常的探討,來自會議,來自各種討論,但是今天大模型得不到這些數據。所以,造成的問題今天在企業用大模型的時候,它回答得都很對,但沒有什么用,都是常識性的回答,很難和私有的知識連接起來。如果真的要企業應用,私有數據是關鍵。
這次蘋果發布siri iOS18那么成功,就是因為它把手機里的各種數據打通了,郵件等等都讓大模型處理。其實都不是大模型,它在端上處理的好像就是8000萬參數還是1.2億參數的模型,但數據打通之后,爆發出來的能量驚人。所以我們提供的解決方案是一定要結合企業的私有知識,像向量數據、RAG等等,但要做好都不容易。
第二,數據的安全性。大數據和云最大的不同,云在云上,是不拆包的,只要租用我的倉庫,面積越大,我的生意就越好,我不關心你存了什么。大模型不一樣,存的數據它都要看一遍,才能寫報告和整理,這些數據都經過它了,如果不記錄下來還是和人性相違背。即便美國OpenAI這樣的公司都經常暴出數據被抓取等問題,所以企業就應該有自己的私有化大模型。個人以后要用好大模型,也應該有自己的大模型。蘋果iOS18就是個人端的Copilot。
第三,生成式的模型,大模型的幻覺和一本正經的胡說八道,它不知道,但它不知道自己不知道。這是真正可以通達AGI的路,人說錯話,馬上就知道,但大語言模型不是,它一本正經的講林黛玉打虎的故事,講得活靈活現,它沒有反思能力。今天我們發現和大模型打通以后,客服需要95%以上的能力,但大模型只能做到70%,這和模型無關,這構造大模型目前的天然的缺陷。
前兩天有個東西上熱搜了,你問大模型是13.8大還是13.11大,好像只有一個大模型沒有淪陷,因為它就是字符串的學習。
今天業界提出了Agent的方式,通過一套規則或者自我反思、規劃等等,和大語言模型在一起,去完成對一個具體場景的落地,還不能大泛。
還有很多大模型公司覺得找人用一下就可以把大模型做好,不是!我們應該是基于客戶的訴求,做深度評估,才能做部署。我認為真正把標桿才能把很多東西抽象出來。ChatGPT到今天發布才不到兩年,產業鏈上還有很多不成熟,它沒有很好連接的供應商,很多苦活只能自己干。就跟特斯拉做第一輛車,除了買自己的筆記本電池,整個電路都要自己干一遍,才能做自己的產品,現在可以采購寧德時代100度的平臺加個殼就行了。所以,我認為現在大模型處于很早的時代,真的要做企業案例就要和企業深度打磨。
[多媒體演示]
這是我們幫助企業深度打磨的思路。但今天我們主要想分享如何做好機器人,通過私有化的方案不需要特別強的模型,但是做好Agent應用,再加上私有知識庫在很多地方可以做到95%左右準確率,滿足客戶的需求,這件事是可以的。我們提出一個好的企業大模型有三個段位:第一個是給企業用;黃金是把私有數據做好,然后實施;真正的王者是企業如何運營,大模型可以給出判斷。以后大模型會跟新東方說董宇輝到底能不能走,付出多少成本不讓他走是合算的。通過大模型的精準測算,讓自己未來怎么發展好,我覺得這件事以后可以不用靠老俞一個同志了。因為美國就有這樣的公司,專門通過大模型分析,給企業提供決策經營建議。
講一下機器人。
[多媒體演示]
這不是我畫的圖,而是一個基金畫的圖,任何技術都有核心技術,把云上的能力變成端上,第三部分就是應用。我覺得今天大家講應用什么時候會崛起?至少要到明年會在C端看到一些應用開始出現,因為一些基礎的東西,我看智譜AI也發布了一個文生視頻,這個能力不錯,很多人就會圍繞它做開發了,不再是簡單的回答一句話。高通的那款芯片一出來,很多大廠都會在CPU上加上一個AI模塊。這次蘋果發布iOS18,專門說會給手機上開發圖形的API,只有這樣才能出現好的AI應用,或者深度的AI。最后是物理的AI,今天最火的是智深智能,就是自動駕駛、智能座艙都是這個范疇。
今年我們訓練了一個自己的模型,我們訓練這個模型的核心就是讓團隊學習。第二我們就是瞄準小參數,因為我們覺得以后我們的機器人上要跑本地化的模型和云端的相結合。重要的是我們和日語模型加了一下,這是開源模型里日語最好的,說實在話日本人沒有怎么做過,日本人離我們有斷代的差距,現在我們把日語做好,為日本人民提供大模型的服務。
這個PPT沒有做好,好像是唱歌里相聲說得最好、相聲里唱歌最好的。我們說機器人公司里擁有自研大模型,大模型里機器人做得最好的。因為大模型對機器人來說就是大腦,做機器人,自己沒有大腦,買大腦,肯定就做不好。所以我們把大模型定位為機器人的大腦,實現就是執行部分。
18年我就說AI軟件、硬件和服務,為什么這些年一直不溫不火呢?坦誠一下,因為以前AI的體驗做不上去。我女兒經常諷刺我說:老爸,你做了一個智障機器人?那時候雪不夠厚、坡度不久長,今天大語言模型會把這個體驗一下子提升很多。美國說可能會出現一個新物種,用GPU+大語言模型+算力,出現一個類人的新物種,我覺得機器人就是這樣的新物種。
解釋一下剛才的那個問題,為什么我們要做大模型?大模型就是它的大腦,如果我自己不訓一個參數模型,有一天要訓千億數據模型,我們就是要端模一體化,根據場景應用找一款好的模型,做自己的大模型機器人。大模型機器人已經開始一點一點做了,現在我們在1.0階段,但至少要做到3.0、4.0才有體驗上革命般的進步。大家都看到過餐廳的遞送、講解等等,但怎么加入了大模型就不一樣,大家知道Robot這個詞在英語里是“勞動力、奴隸”的意思,在老外眼里人自動的就是Robot,我們翻譯為“機器人”就有了人的概念。在產研上大部分是自動化機器,沒有人的概念,有大模型之后才能真正理解和決策,這是很大的改變。以前大部分都是基于規則,就像中午和羅總聊的,以前都是短刀端到端。
總的來說,它會像人一樣理解世界,而且會作出決策,這個決策不需要人管中間的過程,這是機器人的極大地提升,也是工作量極大地縮小。反正總體來說就是很厲害。
[多媒體演示]
這是新潮傳媒幾個展廳都放了機器人,而且聲音是張繼學的,現在有了大模型,讀一下企業簡介,就可以做介紹和回答了。我們和投資的一家公司做的機器人,大家看到直播間說話的聲音,像一個小姐姐一樣,都是AI生成的,說帶我去生蠔區看看,她就去生蠔區,會說“我們的生蠔又大又新鮮,趕快來吧”。
請小姐姐直播一個月大概賣幾千塊優惠券,但用機器人一天賣幾千塊錢,因為用小姐姐太累了受不了,但是機器人一天可以12小時,如果你愿意甚至可以24小時。這是給雙匯賣鱈魚腸。
今天很火的是具身智能的人形機器人,但是我還是要說自己的觀點,我對雙足在商業化成功不是很看好,作為科研是可以,如果落地到產線上工作,沒有三五年就不可能。盡管馬斯克認為可以,但還是很難,雙臂這件是用臂做一些以前不好做的工作是可能的。所以我們在具身智能發展的是雙臂。
今天有兩個端,一個是Phone,一個是PC,還有一個是汽車,下一個肯定是機器人,讓機器人插上翅膀就會完全不一樣。最后希望所有企業家、創業者都一起全力用好AI,插上AI的翅膀。
謝謝大家!??
新浪聲明:所有會議實錄均為現場速記整理,未經演講者審閱,新浪網登載此文出于傳遞更多信息之目的,并不意味著贊同其觀點或證實其描述。
本文由淺螢喚森于2024-07-27發表在山東天一水務工程有限公司,如有疑問,請聯系我們。
本文鏈接://realrule.com.cn/post/4831.html
發表評論