中國網首頁

首頁  >   向young云  >

專家:加強數字中文建設需從三個維度重塑發展格局

2025-04-01 09:07

來源:中國網

分享到:
鏈接已復制
字體:

中國網4月1日訊(記者 劉佳)20世紀中文信息處理技術解決了漢字進電腦、上網絡的歷史性問題,迎來從“鉛與火”到“光與電”的革命。時至今日,人工智能技術快速發展,中國如何加強數字中文建設,從而推動中文信息處理技術創新發展?

在教育部3月31日舉行的新聞發布會上,中國網記者就此提問北京大學王選計算機研究所所長湯幟。他認為,要聚焦關鍵垂直領域建設語料基礎設施,構建支持大模型訓練的高質量中文數據集,同時形成“技術突破—場景落地—生態繁榮”的良性循環。

中國網記者現場提問。中國教育報記者 張勁松/攝

20世紀80年代,王選院士的團隊發明激光照排技術,并結合漢字的編碼標準,突破了中文數字化的空間限制,讓承載中華文化的中文在全球互聯網空間獲得新生。當前,大語言模型技術對大規模高質量語料提出前所未有的需求,賦予了數據中文化新的歷史內涵和使命任務。中文信息處理技術的發展從以往解決漢字輸入輸出的基礎性問題,進階到當先釋放語言文字數據要素價值的全方位突破。

湯幟認為,加強數字中文建設需從三個維度重塑發展格局,推動中文信息處理技術發展進入新階段:即從重要資源轉化到數據要素價值;從廣泛存在聚焦到關鍵領域應用;從基礎支撐提高到賦能全局發展。

湯幟表示,新形勢下,語言文字將實現從“靜態符號”向“動態數字資產”,從“信息載體”向“生產要素”的轉型,要重點推動語料庫、數據標注與評價等標準的研制,支持文本生成與理解、語言翻譯、情感分析等各種任務。

語言文字“日學而不察、日用而不覺”,廣泛存在于社會生產各個方面。新形勢下,語言文字將實現從符號存儲到智能建模的質變,要聚焦關鍵垂直領域建設語料基礎設施,構建支持大模型訓練的高質量中文數據集。

當前,人工智能技術發展迅速,語言文字信息處理技術創新應用正經歷從“GB2312字符集”到“萬億參數大語言模型”的范式變革。湯幟強調,新形勢下,語言文字將實現與信息技術的深度融合,要形成“技術突破—場景落地—生態繁榮”的良性循環,打造數字化引領品牌,有力服務教育發展、助力科技創新、賦能文化傳承、推動產業升級、促進社會進步。

編審:張艷玲 王月博

主站蜘蛛池模板: 久久综合久久网| 再深点灬舒服灬太大了岳| 97精品国产一区二区三区| 日本中文在线视频| 亚洲国产成人av网站| 精品亚洲福利一区二区| 国产成人亚洲欧美电影| 91精品视频在线免费观看| 成人年无码av片在线观看| 亚洲AV无码乱码麻豆精品国产| 狠狠色综合TV久久久久久| 国产va免费精品高清在线观看| 两个人看的视频播放www| 女人与公拘交酡过程高清视频 | 宝贝乖女好紧好深好爽老师 | 久久精品国产一区二区三区| 毛片网站免费观看| 北岛玲亚洲一区在线观看| 韩国精品福利vip5号房| 国产精品嫩草影院在线播放| www激情com| 无码日韩人妻av一区二区三区| 亚洲AV无码专区国产乱码DVD | 国产在线不卡视频| 天堂在线最新资源| 大学生美女毛片免费视频| 中国一级特黄特色**毛片| 日韩中文字幕免费在线观看| 亚洲国产精品无码成人片久久 | 男女下面一进一出无遮挡gif | 国产一卡二卡≡卡四卡无人| 很污很黄的网站| 国产综合在线观看| a级毛片黄免费a级毛片| 成人午夜私人影院入口| 久久久久久亚洲精品中文字幕| 欧式午夜理伦三级在线观看| 亚洲日本va中文字幕久久| 热re99久久精品国产99热| 免费视频88av在线| 美女免费视频一区二区三区|