标签谢选骏全集

2024年12月11日星期三

谢选骏:AI不能讓愚昧人勝過明智人

《AI改变世界?这里有10个不太乐观的观察》(华尔街见闻 2024-08-16)報道:


自ChatGPT在2022年底迅速爆发以来,数亿人尝试过使用AI,然而真正留存和活跃的用户却并不多。很多人会说“AI很聪明,但并不适合我”,然后耸耸肩离开。


在谷歌、微软等一众科技巨头正热衷为AI疯狂砸钱之际,这项技术带来的实际回报却遭受广泛质疑。高盛甚至评价AI泡沫比互联网泡沫更甚一筹。


人工智能——一项颠覆世界的创新技术,还是泡沫终将破裂?8月16日,媒体观察到10个关于AI并不乐观的现象,包括使用频率低、缺乏杀手级应用、生产力回报不明显、资本支出增长乏力等。


AI使用频率低:大多数人只用过一两次


ChatGPT在2022年底迅速爆发,仅用两个月就达到了1亿用户。数亿人尝试过AI应用,尽管如此大多数人只使用过一两次AI,或者每隔几周才回来使用一次。


过去9-12个月,AI活跃用户没有太大增长


AI应用活跃用户的增长貌似已经进入瓶颈期。谷歌趋势(Google Trends)数据显示,过去 9-12个月中,ChatGPT的活跃用户没有太大增长。


分析师Benedict Evans问道,“如果这是改变一切的神奇事物,为什么大多数人实际上只会说‘非常聪明,但不适合我’,然后耸耸肩走开?”


财报电话会上,企业对AI的关注度有所下降


今年第二季度,AI在公司财报电话会议上的提及次数正在下降。媒体称,各家公司对人工智能的谈论越来越少。


数据显示,二季度财报电话会议上,公司提及人工智能及相关词汇的数量较第一季度显著下滑。


科技巨头资本支出上调,但幅度不大


包括微软、Alphabet、亚马逊和Meta,在最新的季度财报中透露,2024年前六个月的资本支出大幅增加——累计总额达到1060亿美元。后续,亚马逊、谷歌、微软、Meta等大型科技公司的资本支出计划与展望受到密切关注。


投资者们迫切的想知道这些巨头们是否还热衷于砸钱投资AI。不过,据高盛称,在这些公司发布业绩报告后,市场普遍预期2025年科技巨头们的资本支出和研发支出只将增加3%。


AI生产力的滞后,还需要更多时间


高盛的股票研究主管Jim Covello对当前的AI泡沫非常悲观,他认为这种泡沫可能甚至比上世纪末的互联网泡沫更严重。高盛预测AI在未来十年内对经济的实际影响会很有限,AI只会使美国生产力增加0.5%,GDP仅增加0.9%。


数据显示,企业对大语言模型(LLM)表现出极大的兴趣,许多企业正在进行试点和实验,但真正将其部署于业务中的公司并不多。AI本质上是一种技术,而非产品。要使其真正有用,需要将其拆解或重新组合到新的框架、用户体验和工具中,AI大模型离大规模部署还有一段路要走。


就像互联网时期的前期投入的变现也需要漫长的时间,比如宽带建设、消费者购买PC、电子商务基础设施。类似地,iPhone也经历了一个缓慢的发展过程,最初的销售数字不高,直到2010年才真正起飞。


日元套利交易=AI泡沫?


英国知名研究公司BCA Research首席策略师Dhaval Joshi近日发布一项研报,将日元套利交易与AI泡沫相关联。


Joshi认为,所谓“日元套利交易”的平仓以及“人工智能泡沫”的初步退潮实际上可能已成为同一种交易。令人信服的证据是,它们的价格走势完全一致。


AI泡沫不断膨胀


策略师Joshi认为,虽然卖出日元的人可能与买入AI股的人不是同一个人,但卖出日元和“吹大”人工智能泡沫之间,其实是同一个交易过程的两端。卖出日元(借入日元进行套利交易)促成了人工智能泡沫的扩大,而人工智能泡沫又促进了日元的抛售。


Joshi认为,日元套利平仓交易还在继续。这也意味着,人工智能泡沫还会扩大……


AI杀手级应用在哪里?


华尔街机构们认为,科技巨头在AI领域的资本支出如此之高,却没有带来相应的回报和更高效的应用。在过去两年里,只出现了ChatGPT和Github Copilot两个现象级AI产品。


而在人工智能领域,风险投资者更喜欢BTB商业模式。


AI盈利表现不足


高盛认为,只有专注于AI基础建设类型的公司盈利表现还不错……


比如,亚马逊、谷歌、微软和Meta在AI资本开支上的投入,基本都流向了建造数据中心以及购买英伟达的GPU产品。


企业推动AI培训,但员工真的需要吗?


标普全球正在向埃森哲付费,为3.5万名员工提供“生成式人工智能”培训。


分析师Benedict Evans评价道,“我曾经开玩笑说,如果你连续三次强调数字化转型,一个埃森哲的合伙人就会突然出现,并向你递上一份合同——现在,同样的情况发生在AI上。欢迎来到企业IT的世界~”


“AI培训”真的必要吗,还是一种浪费?


網民嚎叫:


Chieftop519 发表评论于 2024-08-16 17:07:15

史上最大泡沫

城头散仙 发表评论于 2024-08-16 15:45:12

AI 這個詞根本就是兩個字,兩個謊而已。。 既不是Artificial , 更談不上Intelligence. 就是一個語言模型算法的應用罷了。

不允许的笔名 发表评论于 2024-08-16 14:13:30

mobileuser 发表评论于 2024-08-16 12:39:00

sonnet 3.5真是好用太多,另外perplexity也非常棒

========

Perplexity一年200,太贵了。


谢选骏指出:人説“AI改变世界?这里有10个不太乐观的观察”——我看“AI改变世界”的説法就像“炮艦改变世界”的説法一樣,似是而非。


《外媒實測5大AI工具:這款打敗ChatGPT、Gemini奪第一!》(陳建鈞 2024.05.28)報道:


AI與大數據

外媒實測5大AI工具:這款打敗ChatGPT、Gemini奪第一!黃仁勳也愛用它

外媒《華爾街日報》對主流的5款聊天機器人進行評比,ChatGPT卻只拿了第二,誰才是表現最佳的AI模型?


ChatGPT推出至今已經一年半,各家語言模型輩出,但哪款才最適合一般用戶日常使用?近日《華爾街日報》針對5款聊天機器人進行測試,並為各種使用場景的回覆品質排名。


《華爾街日報》針對了ChatGPT、Copilot.Gemini、Claude及Perplexity總共5款聊天機器人,分別就醫療、金融、料理、職場寫作、創意寫作、概要、最新消息、程式以及回應速度等面向進行排名,並且都是使用付費的加強版本。


編輯團隊設計出一系列的提示詞,以測試各個場景的使用結果,並依照其準確度、幫助程度及整體水準來評分,最後給出各個聊天機器人間的排名。


掌握最新AI、半導體、數位趨勢!訂閱《數位時代》日報及社群活動訊息


請輸入 Email

不過他們強調, 這並非科學評估,而是希望反映實際使用這些聊天機器人時得到的回覆。


Perplexity爆冷奪第一

先從結果說起,奪得整體評分第一的並非ChatGPT, 而是由新創公司Perplexity所推出的同名聊天機器人 ,拿下這場「聊天機器人奧運」的金牌。


整體排名的2至5名,則分別是ChatGPT、Gemini、Claude、Copilot。


這並非代表Perplexity在各項領域都碾壓其他對手,不過Perplexity在9項評比中拿下其中3項第一,分別是「概要」、「最新消息」及「程式」。


英國時尚品牌ALLSAINTS攜手自由系統優化IT維運、提升營運效率以及增強顧客體驗

Perplexity商業長謝維連科(Dmitry Shevelenko)指出,「為讓模型更簡單明瞭,我們調整了模型,這使得Perplexity能辨識出重點。」


Perplexity.jpg

Perplexity是華爾街日報這次測試中,綜合表現最佳的一款聊天機器人。 


雖然Perplexity是整體冠軍,但在「回應速度」方面卻大幅落後ChatGPT、Gemini及Copilot。


Perplexity已晉升獨角獸

Perplexity成立於2022年,員工總數不到40人,打造出了世界上第一個對話式AI搜尋引擎,每月有約1,000萬使用人次。


值得一提的是,Perplexity曾獲得輝達(Nvidia)、亞馬遜(Amazon)創辦人貝佐斯(Jeff Bezos)投資。輝達創辦人黃仁勳曾在今年2月受訪時透露,Perplexit是他最偏好的聊天機器人,並且幾乎每天都會使用。


在今年4月的最新一輪融資中,Perplexity募得了6,300萬美元資金,使得身價一舉超過10億美元,晉升獨角獸的行列。


除上述提到的投資者外,Figma執行長菲爾德(Dylan Field)、Y Combinator執行長陳嘉興(Garry Tan)也都參與了本輪融資。


延伸閱讀:黃仁勳愛用Perplexity AI!Perplexity AI是什麼樣的工具?盤點科技大佬AI小幫手


聊天機器人各有優勢戰場

而在各領域回應中,聊天機器人各有優勢戰場。例如ChatGPT,在醫療、料理、回應速度三項評比中獲得第一。


ChatGPT懂做菜

在料理相關的問答裡,其中一個考題,是在給AI指定特定食材,讓其「發揮創意」製作料理。


《華爾街日報》指出,ChatGPT給出的料理「起司豬肉餡蘋果、羽衣甘藍沙拉、巧克力脆餅」兼具創意及可行性。


Gemini懂遺產

Gemini則在金融領域的問答表現最佳。在測試中,關於利率、退休存款、遺產等問題,評審團隊聲稱Gemini在處理遺產方面的題目回應最好,並且提醒了用戶「在沒有專業人士的指導下,不要急著把錢領出來。」


Claude懂寫文案

而Anthropic旗下聊天機器人Claude,是職場寫作領域的冠軍,題目包括要求機器人寫一篇提示詞工程師的招募文案等。


實際上,Perplexity、Gemini和Claude的表現十分接近,不過Claude藉由一篇宣佈寶寶誕生的公告,以些微差距奪冠。


微軟copilot


雖然Copilot這次表現不佳,不過微軟表示他們計畫將GPT-4o整合進去加強性能。 


Copilot,帶來歡樂


雖然微軟的Copilot在多項評比中都是吊車尾,不過創意寫作就是它的舞台了。


在這個評比中,《華爾街日報》給出一堆荒唐的題目要求AI發揮,例如「川普和拜登在路上打架」等,他們聲稱Copilot的回應帶來了許多歡樂。


AI之戰路遙遙,鹿死誰手仍未定

總的來說,這些評比雖然只是一間媒體的內部評分,也一定程度上反應出各個聊天機器人都有自己擅長的領域。


儘管Copilot在這次評分中表現最差,微軟表示他們很快會將OpenAI的最新模型GPT-4o整合進Copilot,提高聊天機器人的能力。


在AI競賽越趨白熱化的情況下,最後誰能成為贏家,或許還很難說。


延伸閱讀:黃仁勳、OpenAI都是金主!才2歲的Figure AI是誰?怎麼讓機器人不只「耍特技」?


資料來源:華爾街日報、Tom's Hardware、Bloomberg


谢选骏指出:人說“外媒實測5大AI工具:這款打敗ChatGPT、Gemini奪第一!”——我看AI似乎可以讓笨蛋變聰明,但卻不能讓愚昧人勝過明智人。

没有评论:

发表评论

谢选骏:與gemini討論死亡與人生

(一)如何理解“死亡幫助我們認清了自己作爲碳基生物的這一處境”? 如何理解「死亡幫助我們認清了自己作為碳基生物的這一處境」? 這句話乍聽之下有些抽象,但其實蘊含著深刻的生命哲學。讓我們來逐層剖析: 1.碳基生物的本質 物質組成:所有地球上的生命形式,包括人類,都是以碳元素為基礎的...