国产无码免费,人妻口爆,国产V在线,99中文精品7,国产成人无码AA精品一,制度丝袜诱惑av,久久99免费麻辣视频,蜜臀久久99精品久久久久久酒店
        訂閱
        糾錯(cuò)
        加入自媒體

        從混元到智譜,六大國(guó)產(chǎn)大模型,編程“手藝”到底怎么樣?

        上周,我們用六個(gè)國(guó)產(chǎn)AI大模型研究了財(cái)報(bào)。

        本周,我們來(lái)測(cè)試一個(gè)更加酷炫且硬核的話題:AI寫代碼。

        人們總是說(shuō),AI一出來(lái),程序員都要失業(yè)了,這說(shuō)法是真是假?

        為了搞清楚這個(gè)問(wèn)題,這次我們?cè)O(shè)計(jì)了一場(chǎng)“AI程序員能力挑戰(zhàn)賽”。

        別擔(dān)心看不懂,我們會(huì)把所有測(cè)試都比喻成你最熟悉的生活任務(wù)。

        這一次,我們盡可能選擇了擅長(zhǎng)編程的參賽選手:

        深度求索:DeepSeek-R1

        騰訊:Hunyuan-TurboS

        阿里:Qwen3-Coder

        智譜:GLM-4.5

        月之暗面:Kimi-K2

        百度:ERNIE-X1-Turbo

        老規(guī)矩,開啟深度思考,關(guān)閉聯(lián)網(wǎng)搜索。

        這次的“AI程序員能力挑戰(zhàn)賽”,采用考駕照的方式。

        我們將通過(guò)四個(gè)“科目”,從易到難,全方位考察參賽選手們的編程能力。

        01

        科目一:理論知識(shí)筆試(基礎(chǔ)知識(shí)問(wèn)答)

        在真正上路(編寫代碼)前,我們得先測(cè)試一下AI參賽選手們的基礎(chǔ)知識(shí)是否牢固。因此,我們選擇了一些編程行業(yè)的“常識(shí)題”。

        測(cè)試題目1:“請(qǐng)用一個(gè)初中生能聽懂的比喻,解釋一下什么是‘面向?qū)ο缶幊?rsquo;(OOP)?”

        “面向?qū)ο缶幊?rdquo;是程序員行業(yè)內(nèi)的一個(gè)核心哲學(xué)。

        專業(yè)化的表述“封裝、繼承、多態(tài)”,別說(shuō)初中生了,不少大學(xué)生和研究生都得犯迷糊。

        這道題考的不是AI“懂不懂”,而是會(huì)不會(huì)“教”。

        測(cè)評(píng)結(jié)果:

        各模型選擇了不同的生活場(chǎng)景,對(duì)面向?qū)ο缶幊讨械慕?jīng)典概念進(jìn)行講解:

        其中,Qwen3-Coder和Kimi-K2的講解全面而生動(dòng),解釋質(zhì)量、準(zhǔn)確性和啟發(fā)性較高。

        DeepSeek-R1、GLM-4.5和ERNIE-X1-Turbo對(duì)于關(guān)鍵的概念有所省略,但仍然能做到易于理解。

        本輪評(píng)分:

        測(cè)試題目2:“解釋一下‘遞歸’是什么,并說(shuō)明使用它時(shí)需要注意什么?”

        “遞歸”是編程領(lǐng)域中一種“自己調(diào)用自己”的奇特技巧,優(yōu)雅但危險(xiǎn)。

        用好了,程序的可讀性和性能都會(huì)得以提升;用不好,程序很容易陷入無(wú)限循環(huán),直到內(nèi)存耗盡而崩潰。

        測(cè)評(píng)結(jié)果:

        各模型異曲同工地都選擇了俄羅斯套娃作為比喻之一。

        同時(shí),詳細(xì)地描述了使用遞歸時(shí)的限制條件。

        所有模型都能對(duì)專業(yè)名詞進(jìn)行正確解釋,且給出的比喻基本相同。

        其中,Qwen3-Coder和GLM-4.5還提及了遞歸的應(yīng)用場(chǎng)景,使回答更加充實(shí);

        而DeepSeek-R1、Hunyuan-TurboS和ERNIE-X1-Turbo在沒(méi)有提及其他概念的情況下,將遞歸與循環(huán)和迭代做了對(duì)比,也是亮點(diǎn)之一。

        本輪評(píng)分:

        測(cè)試題目3:“進(jìn)程和線程有什么區(qū)別和聯(lián)系?舉個(gè)例子說(shuō)明。”

        這是程序員面試的基礎(chǔ)題目之一,涉及計(jì)算機(jī)如何同時(shí)處理多個(gè)任務(wù)的底層原理。

        能講清楚這兩個(gè)概念,證明AI的計(jì)算機(jī)知識(shí)體系相當(dāng)完備。

        測(cè)評(píng)結(jié)果:

        同樣地,各模型首先給出簡(jiǎn)單的比喻,然后從多個(gè)方面對(duì)比二者的區(qū)別和聯(lián)系:

        與上一題類似,各模型給出的比喻大致相同。

        除Kimi-K2外,各模型均從多個(gè)角度對(duì)比了進(jìn)程與線程之間的區(qū)別和聯(lián)系,內(nèi)容充實(shí)。

        其中GLM-4.5給出的答案篇幅較長(zhǎng),包含了簡(jiǎn)單的比喻和專業(yè)的解釋,覆蓋用戶范圍更廣。

        與之相反,Kimi-K2給出的回答卻十分簡(jiǎn)短,雖然易于理解,但并未揭示二者的本質(zhì)。

        本輪評(píng)分:

        科目一成績(jī):

        理論考試環(huán)節(jié),各模型都展現(xiàn)出了碾壓性的實(shí)力。

        這些本身就是計(jì)算機(jī)領(lǐng)域頂尖水平的“考生”,知識(shí)儲(chǔ)備淵博,表達(dá)清晰,比喻也很精妙。

        從評(píng)分來(lái)看,Qwen3-Coder和GLM-4.5,在理論方面略勝一籌。

        如果光看筆試成績(jī),這些AI恐怕已經(jīng)可以勝任本科生的計(jì)算機(jī)“私人教師”。

        不過(guò),程序員的世界,終究還要靠代碼說(shuō)話。

        02

        科目二:動(dòng)手實(shí)踐課(入門級(jí)編程任務(wù))

        理論知識(shí)過(guò)完,就來(lái)到基礎(chǔ)操作環(huán)節(jié)。

        這就像科目二中的“倒車入庫(kù)”等環(huán)節(jié),需要手眼協(xié)調(diào),考驗(yàn)基本功是否扎實(shí)。

        測(cè)試題目1:“寫一個(gè)經(jīng)典的‘FizzBuzz’問(wèn)題:從1打印到100,如果是3的倍數(shù)就打印‘Fizz’,5的倍數(shù)就打印‘Buzz’,同時(shí)是3和5的倍數(shù)就打印‘FizzBuzz’,其他情況直接打印數(shù)字。”

        從我們的角度看,這不過(guò)是一道小學(xué)生級(jí)別的數(shù)學(xué)題。

        事實(shí)上,這類編程入門題能夠快速判斷AI的編程邏輯。

        而我們作為“考官”,還要看看AI能不能給出我們一下子想不到的答案。

        測(cè)評(píng)結(jié)果:

        先說(shuō)結(jié)論,AI生成的代碼均可正確運(yùn)行,給出的答案共有兩種:

        一是逆向邏輯:先判斷15的倍數(shù),再分別判斷3和5的倍數(shù);

        二是字符串拼接:先判斷3的倍數(shù)后輸出字符串Fizz,再判斷5的倍數(shù)后直接拼接Buzz。

        DeepSeek-R1、GLM-4.5、Kimi-K2和ERNIE-X1-Turbo都只給出了第一種答案。

        Hunyuan-TurboS和Qwen3-Coder則成功給出了兩種答案,智能程度滿分。

        本輪評(píng)分:

        測(cè)試題目2:“寫一個(gè)函數(shù),用來(lái)判斷一個(gè)輸入的正整數(shù)是不是‘素?cái)?shù)’(也叫質(zhì)數(shù))。”

        引入素?cái)?shù)的概念,相比上一題稍難一些,人類可能難以一眼看出解法。

        但細(xì)想一下,實(shí)際上核心思路很簡(jiǎn)單:

        判斷一個(gè)數(shù)是不是素?cái)?shù),沒(méi)必要從2一直除到n-1。只需要除到它的“平方根”就行了。

        這次,要考驗(yàn)AI對(duì)數(shù)學(xué)概念的程序化轉(zhuǎn)換能力和淺層次的算法優(yōu)化意識(shí)。

        測(cè)評(píng)結(jié)果:

        所有模型都給出了正確的算法;

        除Hunyuan-TurboS外,所有模型均給出了可運(yùn)行的代碼;

        除Hunyuan-TurboS和Kimi-K2外,其余模型均給出了時(shí)間復(fù)雜度。

        值得關(guān)注的是,Hunyuan-TurboS和GLM-4.5均指出在數(shù)字較大時(shí)可以使用Miller-Rabin素性測(cè)試等更高效的算法。

        而Qwen3-Coder不僅給出了正確的算法,還給出了適合批量判斷的埃拉托斯特尼篩選法,也給出了時(shí)間復(fù)雜度。

        本輪評(píng)分:

        測(cè)試題目3:“寫一個(gè)函數(shù),判斷一個(gè)字符串是不是‘回文’。”

        這道題在一定程度上屬于“開放式”題目,實(shí)現(xiàn)辦法多種多樣,考驗(yàn)AI處理字符串的能力。

        由于解決方案較多,由人類來(lái)評(píng)判可能有失偏頗,我們請(qǐng)同行Gemini 2.5作為裁判進(jìn)行評(píng)判。

        測(cè)評(píng)結(jié)果:

        “裁判”從方案廣度與深度、代碼質(zhì)量與規(guī)范、解釋與教學(xué)性、獨(dú)特亮點(diǎn)和主要不足這五方面進(jìn)行了客觀的評(píng)價(jià):

        DeepSeek-R1:

        方案廣度與深度:高,提供了空間優(yōu)化

        代碼質(zhì)量與規(guī)范:高,代碼嚴(yán)謹(jǐn)

        解釋與教學(xué)性:高,復(fù)雜度分析準(zhǔn)確

        獨(dú)特亮點(diǎn):提供了最高效的空間解法

        主要不足:方案種類較少

        Hunyuan-TurboS:

        方案廣度與深度:中,方案實(shí)用但缺少最優(yōu)解

        代碼質(zhì)量與規(guī)范:高,解法具備Python特色

        解釋與教學(xué)性:極高,排版清晰,總結(jié)表格

        獨(dú)特亮點(diǎn):教學(xué)性和用戶體驗(yàn)最佳

        主要不足:缺乏空間復(fù)雜度的最優(yōu)解|

        Qwen3-Coder:

        方案廣度與深度:極高,四種方法,包含遞歸

        代碼質(zhì)量與規(guī)范:極高,組織良好,包含測(cè)試函數(shù)

        解釋與教學(xué)性:高,對(duì)比清晰

        獨(dú)特亮點(diǎn):技術(shù)最全面,廣度與深度兼?zhèn)?/p>

        主要不足:排版不夠生動(dòng)

        GLM-4.5:

        方案廣度與深度:中,專注最優(yōu)解

        代碼質(zhì)量與規(guī)范:極高,包含使用類型提示

        解釋與教學(xué)性:高,包含執(zhí)行流程示例

        獨(dú)特亮點(diǎn):對(duì)最優(yōu)解的解釋最形象

        主要不足:方案單一,廣度不足

        Kimi-K2:

        方案廣度與深度:低,僅有一種方案

        代碼質(zhì)量與規(guī)范:高,使用了__name__(Python編程風(fēng)格)

        解釋與教學(xué)性:極高,語(yǔ)言最親切、口語(yǔ)化

        獨(dú)特亮點(diǎn):親和力第一,代碼結(jié)構(gòu)規(guī)范

        主要不足:技術(shù)深度最淺

        ERNIE-X1-Turbo:

        方案廣度與深度:中,專注于接口設(shè)計(jì)

        代碼質(zhì)量與規(guī)范:高,但有瑕疵

        解釋與教學(xué)性:高,展示不同應(yīng)用場(chǎng)景

        獨(dú)特亮點(diǎn):體現(xiàn)API設(shè)計(jì)思想,函數(shù)靈活可配置

        主要不足:測(cè)試用例有邏輯錯(cuò)誤

        本輪評(píng)分:

        科目二成績(jī):

        到了實(shí)踐環(huán)節(jié),“考生”們開始展現(xiàn)出區(qū)分度。

        Qwen3-Coder在三道測(cè)試題中都給出了完美的回答,毫無(wú)疑問(wèn)獲得滿分,排行第一;

        DeepSeek-R1和GLM-4.5也給出了高分回答,保證答案正確的情況下各具特色;

        Hunyuan-TurboS和ERNIE-X1-Turbo則都出現(xiàn)了細(xì)小的錯(cuò)誤,令人遺憾。

        科目二的測(cè)試題目難度大概和大一大二的普通計(jì)算機(jī)學(xué)生水平相當(dāng)。

        由此可見,AI完成計(jì)算機(jī)專業(yè)部分課程的期末考試已經(jīng)不在話下。

        03

        科目三:生活應(yīng)用題(解決實(shí)際問(wèn)題)

        由于科目一和科目二還局限于學(xué)術(shù)范圍,我們要再次升級(jí)難度。

        科目三要測(cè)試的是AI能否解決我們生活和工作中的實(shí)際痛點(diǎn)。

        這考驗(yàn)的不僅是AI的編程技巧,還有對(duì)人類需求的理解和解決問(wèn)題的能力。

        測(cè)試題目1:“我桌面上有幾百個(gè)文件,有圖片、文檔和視頻,太亂了。你寫個(gè)程序幫我整理一下,把不同類型的文件放到各自的文件夾里。”

        非常典型的“自動(dòng)化辦公”需求。

        每次看到一臺(tái)電腦的桌面上被堆滿應(yīng)用圖標(biāo),強(qiáng)迫癥都難以呼吸。

        因此,這道題目要求AI編寫一個(gè)與操作系統(tǒng)打交道的腳本。

        需要完成文件的查找、分類、創(chuàng)建文件夾和移動(dòng)文件等一系列操作。

        測(cè)評(píng)結(jié)果:

        所有模型都給出了可運(yùn)行的代碼,并實(shí)現(xiàn)了文件分類的功能。

        其中,GLM-4.5給出了令人驚喜的回答:

        它生成的代碼提供了一個(gè)額外功能:模擬運(yùn)行,即只顯示操作但并不實(shí)際移動(dòng)文件。

        這對(duì)于評(píng)測(cè)來(lái)說(shuō)是不可多得的亮點(diǎn)之一。

        表現(xiàn)相對(duì)較差的則是Kimi,僅給出了圖片、文檔和視頻三種分類方式。

        本輪評(píng)分:

        測(cè)試題目2:“我想知道現(xiàn)在外面空氣質(zhì)量怎么樣,如果PM2.5指數(shù)很高,就提醒我戴口罩。幫我實(shí)現(xiàn)這個(gè)功能。”

        難度進(jìn)一步上升。

        這道題的核心難點(diǎn)在于需求與“外部數(shù)據(jù)獲取”掛鉤,專業(yè)術(shù)語(yǔ)叫做“API調(diào)用”。

        AI編寫的程序需要能夠訪問(wèn)一個(gè)提供天氣或氣象相關(guān)數(shù)據(jù)的網(wǎng)站,并獲取PM2.5的數(shù)值。

        而作為評(píng)判者,除了要關(guān)注數(shù)據(jù)的正確性,還要關(guān)注程序的自動(dòng)化程度。

        畢竟,很多網(wǎng)站的數(shù)據(jù)需要先注冊(cè)才能獲取,但“一鍵式”才是我們追求的目標(biāo)。

        測(cè)評(píng)結(jié)果:

        對(duì)于這道難題,各模型給出的答案令人有些失望。

        DeepSeek-R1沒(méi)能給出直接獲取數(shù)據(jù)的方法,給出的方案需要在tianqiapi.com注冊(cè)獲取密鑰,但提供的鏈接也無(wú)法直接訪問(wèn);同樣地,ERNIE-X1-Turbo給出的方案也需要在和風(fēng)天氣注冊(cè)獲取密鑰,且程序只能發(fā)揮定時(shí)檢測(cè)作用而非查詢作用。

        Hunyuan-TurboS提供了兩種方案,一種是使用OpenWeatherMap的API,同樣需要注冊(cè)并獲取密鑰;另一種是直接使用AQICN的公開數(shù)據(jù),實(shí)現(xiàn)了“一鍵式”獲取,雖然數(shù)據(jù)似乎有些不準(zhǔn)確。

        Qwen3-Coder生成的代碼功能較為齊全,能夠成功調(diào)用外部API實(shí)現(xiàn)“一鍵式”獲取,但可惜查詢存在錯(cuò)誤,如輸入城市為北京,但輸出數(shù)據(jù)為上海,且程序運(yùn)行一次后自動(dòng)結(jié)束。

        至于GLM-4.5和Kimi-K2提供的代碼則完全無(wú)法實(shí)現(xiàn)所需功能,也未給出可行方案。

        本輪評(píng)分:

        測(cè)試題目3:“幫我做一個(gè)簡(jiǎn)易的密碼生成器。”

        第三題的需求相對(duì)封閉,不涉及外部依賴,AI的表現(xiàn)肉眼可見的“好起來(lái)了”。

        因此,我們需要關(guān)注AI生成代碼功能是否靈活、齊全。

        測(cè)評(píng)結(jié)果:

        所有模型都能編寫出可用的密碼生成器,但功能存在一定差別:

        DeepSeek-R1非常貼心地在代碼中加入了“避免模糊字符”功能,解決了常見的大寫字母I和小寫字母l的辨認(rèn)問(wèn)題。

        Hunyuan則另辟蹊徑,使用HTML形式編寫了可交互式的密碼生成器,且有密碼強(qiáng)度評(píng)分功能。

        Qwen3-Coder在允許用戶自定義密碼生成規(guī)則的情況下,還允許用戶一次性生成多個(gè)密碼。

        GLM-4.5、Kimi-K2生成的代碼只能在命令行中運(yùn)行,操作比較麻煩;同時(shí),Kimi-K2和ERNIE-X1-Turbo編寫的密碼生成器不允許用戶自定義密碼生成規(guī)則,靈活性較差。

        本輪評(píng)分:

        科目三成績(jī):

        這一次,輪到Hunyuan-TurboS領(lǐng)跑賽道,獨(dú)占榜首。

        先前的測(cè)評(píng)中,我們已經(jīng)知道,對(duì)模型來(lái)說(shuō)獲取準(zhǔn)確的外界信息是一項(xiàng)難度很大的任務(wù)。

        因此,能夠跨越與外界聯(lián)系的“鴻溝”,獲取到氣象數(shù)據(jù),實(shí)屬不易。

        DeepSeek-R1和Qwen3-Coder緊隨其后,在其他兩道測(cè)試題上的表現(xiàn)不錯(cuò),在封閉環(huán)境下發(fā)揮了可靠的能力。

        其余三位考生則各有“短板”,發(fā)揮不佳,令人失望。

        04

        科目四:終極項(xiàng)目挑戰(zhàn)(高階綜合能力)

        這是最終的壓力測(cè)試。

        如果把前面的題目比作“零件”級(jí)別的任務(wù),那科目四就像讓AI動(dòng)手“組裝機(jī)器”。

        下面的題目考驗(yàn)AI的系統(tǒng)設(shè)計(jì)、代碼組織和綜合應(yīng)用能力。

        如果能順利通過(guò)科目四,證明AI已經(jīng)是代碼領(lǐng)域內(nèi)一名合格的“司機(jī)”。

        測(cè)試題目1:“幫我寫一個(gè)網(wǎng)頁(yè)版的待辦事項(xiàng)列表(To-Do List)。”

        入門級(jí)的前端項(xiàng)目。

        它不只是一個(gè)后臺(tái)腳本,而是需要一個(gè)用戶能直接交互的“界面”。

        這要求AI必須同時(shí)掌握三種“語(yǔ)言”:HTML、CSS和JavaScript。

        測(cè)評(píng)結(jié)果:

        所有模型都設(shè)計(jì)出了功能完備的待辦事項(xiàng)列表。

        值得注意的是,在程序結(jié)構(gòu)方面,只有Qwen3-Coder將HTML、CSS和JS分成了三個(gè)獨(dú)立的文件。而其他五個(gè)模型都選擇了將CSS和JavaScript直接嵌入HTML文件中的做法。

        看起來(lái),Qwen3-Coder的做法并不如其他模型的做法便捷,無(wú)法“開箱即用”;

        但是,“分文件”的做法才是專業(yè)Web開發(fā)者的標(biāo)準(zhǔn)做法,具備較高的可維護(hù)性和可讀性。

        這種方式有助于代碼復(fù)用、團(tuán)隊(duì)協(xié)作和性能優(yōu)化,教授了一種專業(yè)、可持續(xù)的開發(fā)模式。

        盡管對(duì)新手來(lái)說(shuō)稍有門檻,不過(guò)Qwen3-Coder也備注了詳細(xì)的使用方法。

        本輪評(píng)分:

        測(cè)試題目2:“請(qǐng)編寫一個(gè)程序,充當(dāng)一個(gè)簡(jiǎn)單的網(wǎng)頁(yè)信息提取器。它的任務(wù)是訪問(wèn)新浪財(cái)經(jīng)的首頁(yè),然后自動(dòng)提取并打印出該網(wǎng)站首頁(yè)上‘要聞’區(qū)域的前5條新聞標(biāo)題。”

        AI應(yīng)用的熱門領(lǐng)域之一——網(wǎng)絡(luò)爬蟲。

        這道題類似于讓AI派出一個(gè)小機(jī)器人去自動(dòng)瀏覽網(wǎng)頁(yè),從海量信息中精確地抓取所需信息。

        不過(guò),難點(diǎn)并非數(shù)據(jù)的提取,而是復(fù)雜且多變的網(wǎng)頁(yè)結(jié)構(gòu)該如何處理。

        測(cè)評(píng)結(jié)果:

        這道題也讓AI參賽選手們出現(xiàn)了明顯的“分化”。

        很遺憾,DeepSeek-R1、GLM-4.5和ERNIE-X1-Turbo都無(wú)法獲取到指定內(nèi)容。

        相比之下,Hunyuan-TurboS和Kimi-K2的爬取能力明顯增強(qiáng),能夠獲取到網(wǎng)頁(yè)信息,不過(guò)位置有錯(cuò)誤。

        只有Qwen3-Coder出色地完成了任務(wù),爬取到了正確的新聞標(biāo)題。

        本輪評(píng)分:

        測(cè)試題目3:“請(qǐng)用代碼模擬一個(gè)最簡(jiǎn)單的圖書館借書系統(tǒng)。需要有‘書’和‘讀者’這兩個(gè)概念。”

        最后一道測(cè)試題回歸到了純粹的“系統(tǒng)設(shè)計(jì)”,考察前面“面向?qū)ο?rdquo;思想的實(shí)際應(yīng)用。

        事實(shí)上,這也是計(jì)算機(jī)專業(yè)學(xué)生幾乎必定經(jīng)歷過(guò)的課程設(shè)計(jì)題目之一。

        因此,我們將測(cè)評(píng)題目也設(shè)計(jì)為開放式,只告訴了AI最基本的需求。

        除了完成系統(tǒng)的設(shè)計(jì),我們還要著重觀察AI能否添加并完善系統(tǒng)的功能。

        測(cè)評(píng)結(jié)果:

        所有模型都給出了可運(yùn)行的代碼,構(gòu)建了復(fù)雜程度不同的圖書館系統(tǒng)。

        對(duì)于借書、還書的邏輯,所有模型都能夠輕而易舉地正確復(fù)現(xiàn)。

        但是,對(duì)于沒(méi)有直接提出的一些需求,則暴露出部分模型的短板。

        DeepSeek-R1、Hunyuan-TurboS、Qwen3-Coder和GLM-4.5都很自覺(jué)地加入了查詢圖書館藏書清單和查詢用戶借閱清單的功能。

        而Kimi-K2和ERNIE-X1-Turbo卻只實(shí)現(xiàn)了簡(jiǎn)單的借書和還書邏輯。

        另外,我們要求AI設(shè)計(jì)的是圖書館“系統(tǒng)”。

        顧名思義,這個(gè)系統(tǒng)是要能夠與用戶進(jìn)行交互的。

        這里必須夸獎(jiǎng)一波Qwen3-Coder,六個(gè)模型中唯一采用交互式而非測(cè)試用例的AI。

        它生成的代碼提供了兩種運(yùn)行模式,允許使用測(cè)試用例進(jìn)行演示,也允許用戶上手操作:

        同時(shí),實(shí)現(xiàn)的功能也是所有AI中最為齊全的:

        本輪評(píng)分:

        科目四成績(jī):

        毫無(wú)疑問(wèn),在其他模型表現(xiàn)平庸的襯托下,Qwen3-Coder的編程能力一騎絕塵。

        它不僅能夠正確理解人們的實(shí)際需求,還能夠根據(jù)概念來(lái)構(gòu)建一個(gè)完善的微型系統(tǒng)。

        設(shè)計(jì)清晰,邏輯嚴(yán)謹(jǐn),功能強(qiáng)大,令人信服。

        05

        一點(diǎn)基本結(jié)論

        這場(chǎng)駕照考試就到此為止。

        通過(guò)各個(gè)科目的成績(jī),可以看出,Qwen3-Coder輕松拿到了本次考試的榜首。

        不論是在理論知識(shí)、基礎(chǔ)編程、生活應(yīng)用還是項(xiàng)目挑戰(zhàn),它都能夠成為一個(gè)寫代碼的“好幫手”。

        同時(shí),在測(cè)評(píng)過(guò)程中,我們也注意到了一些其他的細(xì)節(jié):

        生成代碼的長(zhǎng)度和速度方面,Qwen3-Coder都體現(xiàn)出了明顯的優(yōu)勢(shì)。

        在科目四的測(cè)試中,它生成的代碼比其他模型要長(zhǎng)數(shù)十行,卻能夠比其他模型更快完成編寫。

        反之,Kimi-K2的代碼風(fēng)格極為簡(jiǎn)潔,長(zhǎng)度極短,因此也基本只能實(shí)現(xiàn)文字意義上的功能。

        但總的來(lái)說(shuō),對(duì)于較為簡(jiǎn)單的需求,現(xiàn)階段的AI水平已經(jīng)足夠。

        那么,回到我們先前討論的問(wèn)題:AI能取代程序員了嗎?

        答案是:目前還不能,但它已經(jīng)在徹底改變“程序員”這個(gè)職業(yè)的定義。

        與其說(shuō)是取代程序員,不如說(shuō)AI是在推動(dòng)自己和程序員的“進(jìn)化”。

        不僅是程序員,對(duì)于有編程需要的學(xué)生和職場(chǎng)人來(lái)說(shuō),AI大模型已經(jīng)成為必不可少的“外掛”。

        以AI目前的能力,解決掉80%以上的重復(fù)枯燥的“體力活”(寫基礎(chǔ)代碼、查資料、寫注釋等)已經(jīng)不在話下。

        同時(shí),它還能在幾分鐘內(nèi),搭建起一個(gè)項(xiàng)目的“毛坯房”,用戶無(wú)需在程序框架上絞盡腦汁,而是可以把精力投入到“室內(nèi)精裝修”(核心業(yè)務(wù)邏輯、用戶體驗(yàn)優(yōu)化、系統(tǒng)架構(gòu)設(shè)計(jì))。

        更重要的是,它能極大地降低編程的入門門檻,那些有創(chuàng)意但不懂技術(shù)的人,已經(jīng)不再需要把自己培養(yǎng)成程序員,就可以借助AI將想法變?yōu)楝F(xiàn)實(shí)。

        說(shuō)實(shí)話,在這次測(cè)評(píng)的過(guò)程中,看到AI在幾十秒內(nèi)就生成了一個(gè)功能完整的程序時(shí),作為一個(gè)幾年前畢業(yè)的計(jì)算機(jī)學(xué)生,我直接愣住了,甚至有點(diǎn)恍惚。

        屏幕上自動(dòng)滾動(dòng)的代碼,結(jié)構(gòu)清晰、注釋齊全,腦海里閃過(guò)的,不是AI生成的速度如此之快、質(zhì)量如此之高,而是當(dāng)年為一個(gè)類似的課程設(shè)計(jì)通宵達(dá)旦的場(chǎng)景。

        以前,為了實(shí)現(xiàn)一個(gè)簡(jiǎn)單的圖書館借閱系統(tǒng),我可能要一邊翻閱C++的“抽象圣經(jīng)”,一邊因?yàn)橐粋(gè)數(shù)據(jù)庫(kù)的BUG在CSDN的帖子間反復(fù)橫跳;為了實(shí)現(xiàn)最簡(jiǎn)單的一個(gè)UI界面,我可能要在使用文檔上花一個(gè)下午,因?yàn)檎褺ug找?guī)讉(gè)小時(shí)而懷疑人生。整個(gè)課程設(shè)計(jì)從開始到運(yùn)行,幾周的時(shí)間并不算長(zhǎng)。

        而現(xiàn)在,AI完成這些的時(shí)間,只用了我喝一杯水的時(shí)間。

        百感交集,有一種青春被“降維打擊”的失落感。以前熬夜攻克的“難題”,現(xiàn)在AI云淡風(fēng)輕地一筆帶過(guò)。與此同時(shí)產(chǎn)生的,是一種難以言喻的惆悵和敬畏。

        我們這一代程序員,已經(jīng)是見證歷史的一代。我們?cè)秒p手砌墻,而未來(lái)的程序員將直接指揮機(jī)器人蓋起高樓大廈。

        當(dāng)然,這不是一個(gè)時(shí)代的落幕,而是一個(gè)新紀(jì)元的開啟。

        程序員的價(jià)值,將不再是“砌墻”,而是設(shè)計(jì)大廈的“藍(lán)圖”,我們的目標(biāo),是思考它的結(jié)構(gòu)、它的美感和它的價(jià)值。

        當(dāng)然,得帶著AI助手。

        因此,沒(méi)有太多的焦慮,更多的是對(duì)未來(lái)AI時(shí)代的期待。

               原文標(biāo)題 : 從混元到智譜,六大國(guó)產(chǎn)大模型,編程“手藝”到底怎么樣?

        聲明: 本文由入駐維科號(hào)的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場(chǎng)。如有侵權(quán)或其他問(wèn)題,請(qǐng)聯(lián)系舉報(bào)。

        發(fā)表評(píng)論

        0條評(píng)論,0人參與

        請(qǐng)輸入評(píng)論內(nèi)容...

        請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

        您提交的評(píng)論過(guò)于頻繁,請(qǐng)輸入驗(yàn)證碼繼續(xù)

        • 看不清,點(diǎn)擊換一張  刷新

        暫無(wú)評(píng)論

        暫無(wú)評(píng)論

          人工智能 獵頭職位 更多
          掃碼關(guān)注公眾號(hào)
          OFweek人工智能網(wǎng)
          獲取更多精彩內(nèi)容
          文章糾錯(cuò)
          x
          *文字標(biāo)題:
          *糾錯(cuò)內(nèi)容:
          聯(lián)系郵箱:
          *驗(yàn) 證 碼:

          粵公網(wǎng)安備 44030502002758號(hào)

          主站蜘蛛池模板: 国产熟女在线播放| 国产小仙女一区二区三区| 日韩成人社区| 婷婷综合五月| 9191久久| 南充市| 超碰人人艹| 国产夫妻自拍网| 精品自拍偷拍| 91亚洲视频| 岛国在线无码| 撸啊撸激情久久| 国产玖玖| 亚洲丝袜在线播放| 亚洲自拍偷拍一区| 伊人网综合| 熟女中文字幕丝袜日韩| 康平县| 超碰老司机| 熟妇导航| 清镇市| 黄片视频国产| 九九成人精品| 永定县| 国产无码专区| 成人福利网站导航秘?涩涩屋| 诸暨市| 丁香久久婷婷| 国产熟女真品久| 欧美成人无码大胆A片软件蜜臀| 91色在线视频| 亚洲熟女免费在线视频| 91精品无码| 奇骏影院在线观看免费版| 庄河市| 亚洲熟妇无码成人A片| 苏尼特左旗| 久久机热| 亚洲成人Av| 易门县| 97人妻免费公开视频|