天天精選!陶哲軒甩出調教GPT-4聊天記錄,點擊領取大佬的研究助理
衡宇 蕭簫 發自 凹非寺
量子位 | 公眾號 QbitAI
鵝妹子嚶,天才數學家陶哲軒搞數學研究,已經離不開普通人手里的“數學菜雞”GPT了!
【資料圖】
就在他最新解決的一個數學難題下面,陶哲軒明確指出自己“使用了GPT-4”,后者給他提出了一種可行的解決方法。
借助GPT-4,他不僅成功地突破了這一難題,還將答案分享在了MathOverflow上:
它給我提供了最終的解題思路,接下來我只需要繼續計算就行。
為了給更多數學家分享用GPT-4工作的便利性,陶哲軒還將自己的聊天記錄po了出來,里面完整地記載了他和GPT-4的對話。
可以看見,在這份聊天記錄中,他把GPT-4稱呼為“專業數學合作者”,而不僅僅是一個普通的數學助手。
這個身份屬實不一般了,不知道之后陶哲軒寫論文的時候會不會把GPT-4列為共同作者(手動狗頭)。
不僅如此,戳對話記錄底部的“continue this conversation”按鈕,還能一鍵把對話記錄導入自己的ChatGPT中,突然闖入人類大師和AI的交談。
陶哲軒解決了什么新問題?
陶哲軒研究的問題,是一個兩天前在數學網站MathOverflow上更新的提問。
這個名叫“優雅的遞歸之A301897”問題,具體長這樣:
其中,A301897是一個被整數數列網站OEIS收錄的數列:
這個數列中有一系列來自長度為n的排列b的數,它們有一個共同點,就是滿足Diaconis-Graham不等式且等號成立。
Diaconis-Graham不等式由戴康尼斯(Persi Diaconis)和葛立恒(沒錯,就是“最大數”之父Ronald Graham)于1977年共同提出,屬于概率統計方面的研究。
顯然,這一大段提問中不僅夾雜著大量專業數學公式,而且還涉及需要跳轉的網頁資料。
作為數學公認不太好的“數學菜雞”,GPT-4真的能像一名專業數學家那樣快速讀懂公式、給出解決問題的專業建議嗎?
事實上,相比直接把問題復制粘貼給GPT-4,陶哲軒做了三件事:
首先,做一些提示工程,明確GPT-4的“身份”和“目標”。其中身份是“一個擅長給技巧性建議的數學合作專家”,目標是“提供一些建議”而非解決問題。
然后,相比直接把大段公式復制進GPT-4提問欄(確實可以這樣做),陶哲軒選擇將問題描述轉成Markdown格式。
最后,涉及需要GPT-4自己查找資料的內容,陶哲軒將它轉變成一個引用注釋,并在結尾給出網址。
完整的提問過程長這樣:
也就是說,相比讓GPT-4直接化身數學家去“解決問題”,陶哲軒只是把它當成一個提供靈感來源的“專家”,給自己建議一些研究的方向。
GPT-4很快給出了8個具體的建議:
1、理解問題:在深入證明之前,確保你理解了問題中的每一項。如果你不熟悉Diaconis-Graham不等式,研究一下它,了解表達式a(n)和R(n, q)中的每一項代表什么。
2、簡化表達:有時候,復雜的表達可以被簡化。例如,你可能想看看表達式中a(n)的二項式系數是否可以簡化,或者是否可以用更簡單的方式計算總和。
3、歸納法:由于R(n, q)是遞歸定義的,因此證明猜想的一種自然方法是使用數學歸納法。你可能想要證明,如果這個猜想對n成立,那么它對n+1也成立。
4、生成函數:另一種方法是使用生成函數。嘗試找到a(n)和R(n, 0)的生成函數,然后證明它們是相等的。這有時可以把一個復雜的組合問題變成一個更簡單的代數問題。
5、漸近分析:正如你提到的,分析a(n)和R(n, 0)的漸近行為可能會對它們的關系有一些深入的了解。這有時可以用斯特林的階乘近似來實現,或者通過分析表達式中的主導項來實現。
6、數值證據:雖然不是證明,但收集數值證據有時可以讓我們了解如何證明一個猜想。因為你有PARI/GP代碼,可以用數值來檢查猜想,你可能想讀一讀每個序列的前幾項,看看是否能發現任何模式。
7、尋找類似問題:有時,一個問題或猜想是一個已知問題的泛化或變體。在組合文獻中尋找類似的問題或定理,看看它們的證明是否可以適用于這個問題。
8、尋求反饋和合作:不要猶豫,從同事那里尋求反饋,或者在MathOverflow這樣的論壇上發布你的部分結果。協作和同行評議通常是解決復雜數學問題的關鍵。
最終,陶哲軒使用建議4,也就是生成函數的方法,成功解決了問題。
當然,解決問題的過程并不需要用到GPT-4,采用MAPLE工作表+紙筆手動計算就能完成。陶哲軒也嘗試了漸進分析(建議5)的方法,不過事實證明還是用生成函數更有效。
簡單來說,陶哲軒只是用GPT-4給自己提供不同的解題思路,也就是“解題靈感”,但具體怎么解答,也就是更加數學的方法,他則不會交給GPT-4來完成。
至于“查資料”這種GPT-4的應用,陶哲軒也發揮到了極致。
例如在思考問題時,他還會把自己的“靈光乍現”拿出來和GPT-4討論一下,例如他覺得這個問題和卡特蘭數(Catalan numbers)有相似之處,希望GPT-4幫他查找一下對應的資料。
GPT-4很快給出了對應的回答,這也促使陶哲軒對另一個問題產生了新的靈感。
簡單來說,陶哲軒在短短兩段與GPT-4的對話中,展示了數學家使用GPT-4的正確姿勢——找靈感和查資料。
這樣一來,即使“數學菜雞”如GPT-4,也能成為數學家的AI助理了。
大佬是怎么玩兒GPT的
分享人類大師和AI的聊天記錄之余,陶哲軒的乳齒象博文里還附帶著一份貼心指南,是他使用ChatGPT和GPT-4的經驗之談。
根據他過去的實操經驗,最要緊的第一點:
不要試圖讓AI直接回答問題,因為這幾乎肯定會得到一些看起來專業的廢話。
為了避免GPT成為廢話文學大王,行之有效的方案如下:
讓AI扮演合作者的角色,而后讓它提供策略建議。
Like this:
除此之外,“數學菜雞”GPT,在大數學家手里能有什么用處?
陶哲軒大概的意思是醬嬸兒的:
ChatGPT數學能力雖然不咋滴,但對做學術研究的人來說是個發散思維的好工具。
(對普通人來說有點不太專業,但對搞數學的學術人員來說剛剛好)
怎么解釋用來“發散思維”這句話呢?
陶哲軒表達出來的觀點是,既然ChatGPT在具體數學問題上給出的答案是不完全正確的,那不如索性發揮發揮它生成答案部分正確的特性。
簡而言之,就是讓它幫你找靈感balabalabla:
在處理數學問題時,可以讓ChatGPT這類大語言模型做一些半成品的語義搜索工作。也就是說,ChatGPT不用提供確切的答案,只用生成一些可能的提示。
這樣一來,依據GPT生成的提示+傳統搜索引擎搜索,就能很輕松get答案。
而且他還自曝,在GPT-4發布之前,他本人就從微軟那里獲得了訪問資格。
也就是和微軟154頁《AGI的火花》論文里同款,未經過安全訓練但能力更強的滿血版。
從陶哲軒的反饋中可以看到,GPT-4非常擅長在和人類對話時進行一些cosplay,比如充當富有同情心的傾聽者、熱情洋溢的反饋者、富有創造力的靈感來源、翻譯者或教師,或者是魔鬼的代言人。
與此同時,對于AI在數學研究中的表現,陶哲軒給出的大膽卻又嚴謹的預言:
當與形式證明驗證器、互聯網搜索和數學符號包等工具整合時,2026年的AI,如果使用得當,將成為數學研究中值得信賴的共同作者,而且在許多其他領域也是如此。
除了數學研究,GPT-4已經是陶哲軒生活中的全方位小助手了。
他經常使用GPT-4回答一些隨意、措辭含糊的問題,這些問題以前需要在搜索引擎里精心調整關鍵詞才行。
還有位同事,因為親戚拿到重癥診斷而郁郁寡歡。為此,陶哲軒讓大手一揮,讓GPT-4洋洋灑灑寫了封慰問信。
結果呢?同事眼含熱淚,被感動哭了。
最后說回陶哲軒用GPT-4解決數學難題這事兒上來。
在MathOverflow下,有的網友覺得他不應該用GPT來回答數學問題,感覺是個很敏感的話題。
但還是有人表示了資瓷,表示覺得真的是泰庫辣~
陶哲軒倒是毫不避諱地站出來表明了自己的立場,他倒不覺得有啥不好:
現在的擔憂,跟維基百科流行初期時大家討論的重點也沒啥區別……現在在維基百科上get初始線索,并且在引為論點時附上鏈接,展現它是我論據的一部分,都是大伙兒習以為常的事情。
并且陶哲軒看法還挺堅定,那就是“相信大家以后也會覺得用GPT來支持研究,沒啥不妥當的呢”~
加入陶哲軒和GPT-4的對話:
https://chat.openai.com/share/53aab67e-6974-413c-9e60-6366e41d8414
參考鏈接:
[1]https://mathoverflow.net/questions/449361/elegant-recursion-for-a301897
[2]https://mathstodon.xyz/@tao/110601051375142142
[3]https://finmath.stanford.edu/~cgates/PERSI/papers/77_04_spearmans.pdf
關鍵詞:
您可能也感興趣:
為您推薦
全力補強!巴薩有意富勒姆中場帕利尼亞,本菲卡中場弗洛倫蒂諾也在引援名單中|天天微頭條
暴雨黃色預警:廣西廣東江西等地部分地區將現大暴雨|世界最新
全球通訊!第二次嘗試用WINDOS內建畫板畫黑膠狼
排行
最近更新
- 天天精選!陶哲軒甩出調教GPT-4聊天記錄,點擊領取大佬的研究助理
- 攻堅關鍵核心技術 河南加速領跑超硬材料賽道 天天報資訊
- 哇哦,迪卡儂造車了!!!
- 直能加什么偏旁(直可以加什么偏旁?) 天天快資訊
- 環球觀天下!中國加快培育發展太空經濟新業態
- 有結果的付出叫付出,沒有結果的付出叫代價,st左江
- 環球快消息!聚焦:趙麗穎,吳越,張嘉倪,王俊凱,孫千
- 焦點消息!濟南高新:擬向控股股東關聯方定增募資不超4億元
- 世界速遞!結構性存款有什么優勢?適合什么投資者?_熱頭條
- 【全球報資訊】「風口解讀」去年10月來漲超90%,盛視科技員工...
- 科技與狠活!這些大國重器、高端智造亮相尼山|當前聚焦
- 觀天下!紅豆粉做什么好吃?
- 【全球報資訊】國產巨頭相繼倒下!中國新能源、芯片行業碰壁...
- 李云澤會見淡馬錫董事長林文興 世界即時
- 618買游戲本,必備技能。 世界熱議
- 云南法院近年來對毒品案件重刑率始終保持高位 環球視點
- 世界快播:2023年文化和旅游數字化創新示范案例征集評選工作啟動
- 國際觀察:強推排污入海計劃折射日本道德赤字與智慧困境|環球...
- 車流量增長45.15% 端午假期寧夏高速公路路網運行平穩有序-世界視點
- 經驗分享:如何選擇18歲女孩最佳生日禮物?
- 今日關注:明起試用!杭州亞運數字專用車道別隨便走 當心被罰
- 6月25日河南地區氫氟酸市場價格暫穩
- 今年1月-5月進出口增長強勁 廈企享退稅120億
- 世界時訊:6月25日福建龍氟新材料氫氟酸價格暫穩
- 氣象分析:今年夏天有多熱?
- 環球簡訊:"反詐民警"要求匯款驗資?南京江北警方發警示提醒
- 親手種下礬根、玉簪、百子蓮……虹口建成4個社區小微綠色生態...
- 每日快訊!生活之見、藝術之鑒——極目新聞太太學堂端午藝術之旅
- 【盈警】榮豐億控股(03683.HK)料年度盈轉虧不少于約1070萬美元
- 今年中國快遞業務量已達600億件 比2019年提前172天 今日觀點