久涩av,国产4p,潜伏电影在线观看免费观看完整版,五月视频,泰山成人中文版未删减版,特工电影在线观看完整版免费,国产在线观看91精品一区

<kbd id="m0ed4"></kbd>

荊楚網(wǎng) > 最新播報

專家解讀token中文名為何定為“詞元”

發(fā)布時間：2026年03月30日14:51 來源：中國科學(xué)報

近日，全國科學(xué)技術(shù)名詞審定委員會發(fā)布《關(guān)于發(fā)布試用人工智能領(lǐng)域名詞token中文名“詞元”的公告》，決定在綜合考量社會各界意見建議的基礎(chǔ)上，優(yōu)先推薦“詞元”作為人工智能領(lǐng)域名詞token的中文名，并面向全社會發(fā)布試用。

“詞元”這一定名符合單義性、科學(xué)性、簡明性、協(xié)調(diào)性等科技名詞審定原則。該定名經(jīng)全國計算機(jī)科學(xué)技術(shù)名詞審定委員會審定后，由全國科學(xué)技術(shù)名詞審定委員會批準(zhǔn)向全社會發(fā)布試用。

清華大學(xué)計算機(jī)系副教授東昱曉認(rèn)為，“詞元”的定名捕捉了其在人工智能語言模型中作為“基本離散符號單元”的本質(zhì)，又可以通過類比自然延伸至多模態(tài)領(lǐng)域。在“詞元”這一定名中，“詞”點明其在語言場景下的根源，體現(xiàn)出token與表達(dá)對象語義的密切關(guān)聯(lián)；“元”傳達(dá)出“基本單元”之意，與“元素”等術(shù)語中的“元”保持一致的語義脈絡(luò)。

“token”一詞源于古英語tācen，意為“符號”或“標(biāo)記”。在語言模型中，token是文本經(jīng)過切分或字節(jié)級編碼后得到的最小離散單元。它既可能是人類語言意義上的詞串、單個詞，也可能是詞根、詞綴、子詞或單個字符。語言模型通過對token序列建模，展現(xiàn)出一定的智能水平。

全國計算機(jī)科學(xué)技術(shù)名詞審定委員會副主任委員兼人工智能分委員會主任委員、中國科學(xué)院計算技術(shù)研究所研究員陳熙霖表示，“詞元”一詞可以將“作為語言基本語義單元”這一最初本質(zhì)清晰表達(dá)出來，更貼合其在人工智能中的初始角色。

隨著大模型從純文本走向多模態(tài)，“token”所指已經(jīng)擴(kuò)展。圖像被切分為“圖像塊”并映射為嵌入序列，語音片段可以被量化編碼為離散單元，這些單元在多模態(tài)模型中同樣被稱為token，主要建模手段仍為序列模型。

此時，“詞元”中的“詞”超越了人類語言意義上的“詞”，卻能暗合術(shù)語命名中普遍存在的類比思維——將非文本模態(tài)的離散基本單元也視作“廣義的詞”。這種用法與“詞云”（word cloud）、“詞袋”（bag of word）類似，雖由文本衍生，但已成為人工智能領(lǐng)域中表達(dá)更寬泛語義的通用術(shù)語?！霸~元”在跨模態(tài)場景中承載了“離散基本單元”的語義，這種語義普遍存在于所有模態(tài)之中。

在中文文獻(xiàn)、技術(shù)文檔及學(xué)術(shù)交流中，“詞元”作為描述大模型中token的譯名，逐漸被學(xué)術(shù)界很多學(xué)者認(rèn)同。token是模型將數(shù)據(jù)映射為離散符號序列的基本單位，本身并不攜帶智能，只是承載信息的載體；與“嵌入”“注意力”“隱狀態(tài)”等術(shù)語并列時，保持了風(fēng)格一致性；符合中文“二字詞”偏好，表述簡潔，易于傳播。

國家數(shù)據(jù)局?jǐn)?shù)據(jù)顯示，2024年初，中國日均詞元（token）調(diào)用量為1000億；至2025年底，躍升至100萬億；今年3月，已突破140萬億，兩年增長超千倍。

【責(zé)任編輯:肖夢吟】

武漢沙湖公園內(nèi)數(shù)十株木繡球盛放

武漢沙湖公園內(nèi)數(shù)十株木繡球盛放

武漢光谷5人團(tuán)隊一周產(chǎn)出100分鐘漫劇

武漢光谷5人團(tuán)隊一周產(chǎn)出100分鐘漫劇

巡司河活水公園擴(kuò)建上萬平方米

巡司河活水公園擴(kuò)建上萬平方米

網(wǎng)絡(luò)問政

數(shù)字賦能，史店村繪出基層治理新圖景
一張 “連心網(wǎng)” 串起寺背村幸福路
“云上小哥驛站”激活老舊小區(qū)新動能
普法情景劇把反詐知識送到“指尖”
武昌南湖街道AI賦能激活社區(qū)治理新活力

Copyright ? 2001-2026 湖北荊楚網(wǎng)絡(luò)科技股份有限公司 All Rights Reserved

互聯(lián)網(wǎng)新聞信息許可證 4212025003 －增值電信業(yè)務(wù)經(jīng)營許可證鄂B2-20231273 －廣播電視節(jié)目制作經(jīng)營許可證（鄂）字第00011號
 信息網(wǎng)絡(luò)傳播視聽節(jié)目許可證 1706144 －互聯(lián)網(wǎng)出版許可證（鄂）字3號－營業(yè)執(zhí)照

鄂ICP備 13000573號-1 鄂公網(wǎng)安備 42010602000206號

版權(quán)為荊楚網(wǎng) www.americantheists.com 所有未經(jīng)同意不得復(fù)制或鏡像