今天小編分享的教育經驗:今天,大模型都是高考生,歡迎閲讀。
AI 高考作文大比拼。
來源|多知網
作者 |王上
圖片來源 |Pexels
又逢高考,每年作文都是社會關注的重點話題。作文的命題是選拔人才的風向,也體現了價值觀的引領。
在各家大模型征戰的當下,高考可以説是一個真刀實槍的競技場。多知網選取了北京卷大作文,要求二選一,以 " 亮相 " 為主題寫一篇記叙文,或以 " 續航 " 為主題寫一篇議論文。多知網分别讓 GPT-4、ChatGPT ( 3.5 ) 、文心一言、通義千問、訊飛星火予以作答。
在同一題目的競技下,各家可以説都具備寫作的能力,但是水平不一。
從審題方面來説,文心一言還需提升,它寫了兩篇,沒理解題目 " 任選一 " 的含義。
有意思的是,提問方面,首先假設了各大模型就是一名高考生,沒有設定身份。在這種情況下,GPT-4、ChatGPT ( 3.5 ) 、文心一言、通義千問、訊飛星火都選擇了寫以 " 續航 " 為主題的議論文。
在給了提示詞,設定了 " 作文水平很高的北京高中生 " 的身份證後,有的大模型有所進步,有的則會更糟糕。值得注意的是,在設定了身份之後,只有 GPT-4 選擇了以 " 亮相 " 為主題的記叙文。
從體裁來看,各個大模型都理解體裁之間的區别,也給出了相應的書寫要求。可以看到,記叙文的體裁更難一些,門檻更高。
從文采來看,ChatGPT 比較娴熟,GPT-4 更勝幾籌。
GPT-4 與 ChatGPT 相比,GPT-4 能力更強,從理解能力、語言組織能力和流暢度等都高出幾個維度。
值得注意的是,除了 ChatGPT 之外,其餘幾個大模型均未提煉出有亮點的作文題目。
以下為各家大模型的作答情況及點評:
01
考生姓名:GPT-4
點評:結構完整,論點比較詳實。
加了提示詞 " 作文水平很高的北京高中生 " 後再提問的效果——
點評:一篇非常生動的記叙文,結構完整,語言流暢。
02
考生姓名:ChatGPT
點評:言之有理,論點鮮明,邏輯清晰。
點評:有提示詞後更勝一籌,優點是兩篇都有完整的作文題目。
03
考生姓名:文心一言
點評:文心一言可能有糾結症,先寫了 " 續航 ",又補充了一篇 " 亮相 "。此外,兩篇都是議論文,不完全符合體裁要求。
點評:文心一言加入提示詞後,讀懂了題目。依然選擇了 " 續航 " 這一主題,語言表達比第一次有所進步。
04
考生姓名:通義千問
點評:讀懂了題目,也懂題材。看起來中規中矩。不過,不懂為什麼在倒數第二段夾雜了一段 " 亮相 "。
點評:更糟糕了。
05
考生姓名:訊飛星火
點評:讀懂了題目,也懂體裁。還有一段結合實際的小例子,看起來比較符合要求。
點評:加了提示詞後,審題錯誤寫了兩篇。值得肯定的是,明白體裁的區别。不過,情節略顯單薄。
您覺得哪家大模型更符合考官的評卷标準呢?可以在文末的留言區告訴我們。
>