标签谢选骏全集

2024年12月11日星期三

谢选骏:AI不能讓愚昧人勝過明智人

《AI改变世界?这里有10个不太乐观的观察》(华尔街见闻 2024-08-16)報道:


自ChatGPT在2022年底迅速爆发以来,数亿人尝试过使用AI,然而真正留存和活跃的用户却并不多。很多人会说“AI很聪明,但并不适合我”,然后耸耸肩离开。


在谷歌、微软等一众科技巨头正热衷为AI疯狂砸钱之际,这项技术带来的实际回报却遭受广泛质疑。高盛甚至评价AI泡沫比互联网泡沫更甚一筹。


人工智能——一项颠覆世界的创新技术,还是泡沫终将破裂?8月16日,媒体观察到10个关于AI并不乐观的现象,包括使用频率低、缺乏杀手级应用、生产力回报不明显、资本支出增长乏力等。


AI使用频率低:大多数人只用过一两次


ChatGPT在2022年底迅速爆发,仅用两个月就达到了1亿用户。数亿人尝试过AI应用,尽管如此大多数人只使用过一两次AI,或者每隔几周才回来使用一次。


过去9-12个月,AI活跃用户没有太大增长


AI应用活跃用户的增长貌似已经进入瓶颈期。谷歌趋势(Google Trends)数据显示,过去 9-12个月中,ChatGPT的活跃用户没有太大增长。


分析师Benedict Evans问道,“如果这是改变一切的神奇事物,为什么大多数人实际上只会说‘非常聪明,但不适合我’,然后耸耸肩走开?”


财报电话会上,企业对AI的关注度有所下降


今年第二季度,AI在公司财报电话会议上的提及次数正在下降。媒体称,各家公司对人工智能的谈论越来越少。


数据显示,二季度财报电话会议上,公司提及人工智能及相关词汇的数量较第一季度显著下滑。


科技巨头资本支出上调,但幅度不大


包括微软、Alphabet、亚马逊和Meta,在最新的季度财报中透露,2024年前六个月的资本支出大幅增加——累计总额达到1060亿美元。后续,亚马逊、谷歌、微软、Meta等大型科技公司的资本支出计划与展望受到密切关注。


投资者们迫切的想知道这些巨头们是否还热衷于砸钱投资AI。不过,据高盛称,在这些公司发布业绩报告后,市场普遍预期2025年科技巨头们的资本支出和研发支出只将增加3%。


AI生产力的滞后,还需要更多时间


高盛的股票研究主管Jim Covello对当前的AI泡沫非常悲观,他认为这种泡沫可能甚至比上世纪末的互联网泡沫更严重。高盛预测AI在未来十年内对经济的实际影响会很有限,AI只会使美国生产力增加0.5%,GDP仅增加0.9%。


数据显示,企业对大语言模型(LLM)表现出极大的兴趣,许多企业正在进行试点和实验,但真正将其部署于业务中的公司并不多。AI本质上是一种技术,而非产品。要使其真正有用,需要将其拆解或重新组合到新的框架、用户体验和工具中,AI大模型离大规模部署还有一段路要走。


就像互联网时期的前期投入的变现也需要漫长的时间,比如宽带建设、消费者购买PC、电子商务基础设施。类似地,iPhone也经历了一个缓慢的发展过程,最初的销售数字不高,直到2010年才真正起飞。


日元套利交易=AI泡沫?


英国知名研究公司BCA Research首席策略师Dhaval Joshi近日发布一项研报,将日元套利交易与AI泡沫相关联。


Joshi认为,所谓“日元套利交易”的平仓以及“人工智能泡沫”的初步退潮实际上可能已成为同一种交易。令人信服的证据是,它们的价格走势完全一致。


AI泡沫不断膨胀


策略师Joshi认为,虽然卖出日元的人可能与买入AI股的人不是同一个人,但卖出日元和“吹大”人工智能泡沫之间,其实是同一个交易过程的两端。卖出日元(借入日元进行套利交易)促成了人工智能泡沫的扩大,而人工智能泡沫又促进了日元的抛售。


Joshi认为,日元套利平仓交易还在继续。这也意味着,人工智能泡沫还会扩大……


AI杀手级应用在哪里?


华尔街机构们认为,科技巨头在AI领域的资本支出如此之高,却没有带来相应的回报和更高效的应用。在过去两年里,只出现了ChatGPT和Github Copilot两个现象级AI产品。


而在人工智能领域,风险投资者更喜欢BTB商业模式。


AI盈利表现不足


高盛认为,只有专注于AI基础建设类型的公司盈利表现还不错……


比如,亚马逊、谷歌、微软和Meta在AI资本开支上的投入,基本都流向了建造数据中心以及购买英伟达的GPU产品。


企业推动AI培训,但员工真的需要吗?


标普全球正在向埃森哲付费,为3.5万名员工提供“生成式人工智能”培训。


分析师Benedict Evans评价道,“我曾经开玩笑说,如果你连续三次强调数字化转型,一个埃森哲的合伙人就会突然出现,并向你递上一份合同——现在,同样的情况发生在AI上。欢迎来到企业IT的世界~”


“AI培训”真的必要吗,还是一种浪费?


網民嚎叫:


Chieftop519 发表评论于 2024-08-16 17:07:15

史上最大泡沫

城头散仙 发表评论于 2024-08-16 15:45:12

AI 這個詞根本就是兩個字,兩個謊而已。。 既不是Artificial , 更談不上Intelligence. 就是一個語言模型算法的應用罷了。

不允许的笔名 发表评论于 2024-08-16 14:13:30

mobileuser 发表评论于 2024-08-16 12:39:00

sonnet 3.5真是好用太多,另外perplexity也非常棒

========

Perplexity一年200,太贵了。


谢选骏指出:人説“AI改变世界?这里有10个不太乐观的观察”——我看“AI改变世界”的説法就像“炮艦改变世界”的説法一樣,似是而非。


《外媒實測5大AI工具:這款打敗ChatGPT、Gemini奪第一!》(陳建鈞 2024.05.28)報道:


AI與大數據

外媒實測5大AI工具:這款打敗ChatGPT、Gemini奪第一!黃仁勳也愛用它

外媒《華爾街日報》對主流的5款聊天機器人進行評比,ChatGPT卻只拿了第二,誰才是表現最佳的AI模型?


ChatGPT推出至今已經一年半,各家語言模型輩出,但哪款才最適合一般用戶日常使用?近日《華爾街日報》針對5款聊天機器人進行測試,並為各種使用場景的回覆品質排名。


《華爾街日報》針對了ChatGPT、Copilot.Gemini、Claude及Perplexity總共5款聊天機器人,分別就醫療、金融、料理、職場寫作、創意寫作、概要、最新消息、程式以及回應速度等面向進行排名,並且都是使用付費的加強版本。


編輯團隊設計出一系列的提示詞,以測試各個場景的使用結果,並依照其準確度、幫助程度及整體水準來評分,最後給出各個聊天機器人間的排名。


掌握最新AI、半導體、數位趨勢!訂閱《數位時代》日報及社群活動訊息


請輸入 Email

不過他們強調, 這並非科學評估,而是希望反映實際使用這些聊天機器人時得到的回覆。


Perplexity爆冷奪第一

先從結果說起,奪得整體評分第一的並非ChatGPT, 而是由新創公司Perplexity所推出的同名聊天機器人 ,拿下這場「聊天機器人奧運」的金牌。


整體排名的2至5名,則分別是ChatGPT、Gemini、Claude、Copilot。


這並非代表Perplexity在各項領域都碾壓其他對手,不過Perplexity在9項評比中拿下其中3項第一,分別是「概要」、「最新消息」及「程式」。


英國時尚品牌ALLSAINTS攜手自由系統優化IT維運、提升營運效率以及增強顧客體驗

Perplexity商業長謝維連科(Dmitry Shevelenko)指出,「為讓模型更簡單明瞭,我們調整了模型,這使得Perplexity能辨識出重點。」


Perplexity.jpg

Perplexity是華爾街日報這次測試中,綜合表現最佳的一款聊天機器人。 


雖然Perplexity是整體冠軍,但在「回應速度」方面卻大幅落後ChatGPT、Gemini及Copilot。


Perplexity已晉升獨角獸

Perplexity成立於2022年,員工總數不到40人,打造出了世界上第一個對話式AI搜尋引擎,每月有約1,000萬使用人次。


值得一提的是,Perplexity曾獲得輝達(Nvidia)、亞馬遜(Amazon)創辦人貝佐斯(Jeff Bezos)投資。輝達創辦人黃仁勳曾在今年2月受訪時透露,Perplexit是他最偏好的聊天機器人,並且幾乎每天都會使用。


在今年4月的最新一輪融資中,Perplexity募得了6,300萬美元資金,使得身價一舉超過10億美元,晉升獨角獸的行列。


除上述提到的投資者外,Figma執行長菲爾德(Dylan Field)、Y Combinator執行長陳嘉興(Garry Tan)也都參與了本輪融資。


延伸閱讀:黃仁勳愛用Perplexity AI!Perplexity AI是什麼樣的工具?盤點科技大佬AI小幫手


聊天機器人各有優勢戰場

而在各領域回應中,聊天機器人各有優勢戰場。例如ChatGPT,在醫療、料理、回應速度三項評比中獲得第一。


ChatGPT懂做菜

在料理相關的問答裡,其中一個考題,是在給AI指定特定食材,讓其「發揮創意」製作料理。


《華爾街日報》指出,ChatGPT給出的料理「起司豬肉餡蘋果、羽衣甘藍沙拉、巧克力脆餅」兼具創意及可行性。


Gemini懂遺產

Gemini則在金融領域的問答表現最佳。在測試中,關於利率、退休存款、遺產等問題,評審團隊聲稱Gemini在處理遺產方面的題目回應最好,並且提醒了用戶「在沒有專業人士的指導下,不要急著把錢領出來。」


Claude懂寫文案

而Anthropic旗下聊天機器人Claude,是職場寫作領域的冠軍,題目包括要求機器人寫一篇提示詞工程師的招募文案等。


實際上,Perplexity、Gemini和Claude的表現十分接近,不過Claude藉由一篇宣佈寶寶誕生的公告,以些微差距奪冠。


微軟copilot


雖然Copilot這次表現不佳,不過微軟表示他們計畫將GPT-4o整合進去加強性能。 


Copilot,帶來歡樂


雖然微軟的Copilot在多項評比中都是吊車尾,不過創意寫作就是它的舞台了。


在這個評比中,《華爾街日報》給出一堆荒唐的題目要求AI發揮,例如「川普和拜登在路上打架」等,他們聲稱Copilot的回應帶來了許多歡樂。


AI之戰路遙遙,鹿死誰手仍未定

總的來說,這些評比雖然只是一間媒體的內部評分,也一定程度上反應出各個聊天機器人都有自己擅長的領域。


儘管Copilot在這次評分中表現最差,微軟表示他們很快會將OpenAI的最新模型GPT-4o整合進Copilot,提高聊天機器人的能力。


在AI競賽越趨白熱化的情況下,最後誰能成為贏家,或許還很難說。


延伸閱讀:黃仁勳、OpenAI都是金主!才2歲的Figure AI是誰?怎麼讓機器人不只「耍特技」?


資料來源:華爾街日報、Tom's Hardware、Bloomberg


谢选骏指出:人說“外媒實測5大AI工具:這款打敗ChatGPT、Gemini奪第一!”——我看AI似乎可以讓笨蛋變聰明,但卻不能讓愚昧人勝過明智人。

沒有留言:

發佈留言

廣播劇集第十九卷 Radio Drama Anthology 19 【273、美國國債無以繼】 【274、美國股市龐氏騙】 【275、美國政界內線交】 【276、21世紀的鴉片戰爭】 【277、美國債務定時炸】

 廣播劇集第十九卷 Radio Drama Anthology 19 April 2026 First Edition 2026年4月第一版 谢选骏全集第499卷 Complete Works of Xie Xuanjun Volume 499 (另起一頁) 【273、美國國債無...