跳到主要內容

華語文八年計畫「建置應用語料庫及標準體系105年工作計畫」

計畫編號/立案公文號NAER-2020-012-C-2-5-MOE-03
計畫名稱華語文八年計畫「建置應用語料庫及標準體系105年工作計畫」
計畫類型個別型計畫
計畫主持人
柯華葳
共同主持人
林慶隆張俊盛陳浩然高照明蔡雅薰張郁雯陳柏熹張莉萍
研究員
吳鑑城 Wu, Jian-Cheng白明弘 Bai, Ming-Hong陳茹玲 Chen, Ju-Ling李詩敏 Li, Shih-Min黃淑齡 Huang, Shu-Ling
經費來源教育部
執行方式委辦工作計畫
年度2016
執行期程(起)2016-01-01
執行期程(訖)2016-12-31
執行狀態已結案
計畫經費6000000
摘要  本計畫依據教育部民國102年8月29日「推動全球華語文教育八年計畫(102-109)」之「建置應用語料庫及標準體系」項目架構圖,進行103至109年建置應用語料庫,訂定華語文分級標準及訂定國際接軌之華語文能力指標之工作內涵、期程及所需資源的規劃。所用方法包括文件分析、訪談及焦點團體座談等方法。   結果發現,關於華語文語料庫建置的必要性,語料庫是華語文教育產業發展的核心,其內容包括書面語、口語、華英雙語、及學習者等語料庫。有了真實語料的驗證,華語文教材的分級標準及學習者能力指標的建構,才能符合語文實際使用的情境,進而教學能力認證考試及華語文能力測驗才有堅實的依據,而且,經由語料庫語料的分析,可以編輯教材、文法書及學習者辭典。至於在教學學習的應用,可發展華語教學應用軟體APP、E-learning學習平台、華文拼字檢查、文法檢查、易讀性自動分級、華文作文評分,甚至自動產生華文例句及試題等應用,最後進而應用在華英雙語檢索及翻譯。國內目前雖然有一些語料庫,但是無論在建置目的、語料的品質或數量,都無法完全支援對外華語教學。大陸與日本都由其教育部或由獨立的國家機構來建立國家型的語料庫。華語文語料庫不僅是國家語文的基礎建設,亦是國家科技與教育實力的具體象徵。關於「建構及應用語料庫」之規劃,完成語料庫之授權辦法和營利加值利用之收費辦法之初步規劃,及完成研訂華語文應用語料庫建置及使用要點草案。語料庫建置期程分為5個階段,預計103年至107年間收集語料共5億7千萬字,並配合建置應用系統。   在「訂定華語文分級標準」之規劃,瞭解國際在華語文漢字、詞彙、語法、篇章之分級標準情形並完成研訂華語文漢字、詞彙、語法、篇章之分級標準之規劃,暨完成檢視華語文漢字、詞彙、語法、篇章分級標準之合理性及可行性,以及與國際接軌之規劃。而且,瞭解國際在檢定中文文章及教材難度的可讀性公式情形,完成研訂檢定中文文章及教材難度的可讀性公式之規劃,暨完成檢視檢定中文文章及教材難度可讀性公式的信效度之規劃。   在「訂定國際接軌之華語文能力指標」之規劃,瞭解國際在華語聽、說、讀、寫、譯各級能力指標情形與檢視國際在制訂華語文能力指標情形,研訂華語聽、說、讀、寫、譯各級能力指標與研擬共通性(核心)華語文能力指標之規劃,並檢視華語聽、說、讀、寫、譯各級能力指標在課程規劃、教材開發、測驗評量等之轉化情形及其合理程度之規劃。而且,探究國外華語文檢定測驗及相關系統,完成檢驗研發之華語文能力指標與國外華語文檢定系統之對應情形,並做適當修訂,以利與國際接軌之規劃。另外,瞭解不同專業領域在華語文專業術語應用之需求評估,完成針對部分專業領域,逐年研擬符合不同學習目的之華語文能力指標,檢驗研發之不同專業華語能力指標在課程規劃、教材開發、測驗評量之連結程度與轉化情形之規劃。而且,提出103年至109年「建置應用語料庫及標準體系」預估的經費,每年約需2千多萬元。   對教育政策之建議與貢獻:在即刻可行的建議方面,提出包括專業取向、經費與人力的限制影響計畫規模、刪除或縮小影音資料庫建置,及分級標準和能力指標子計畫需合併等建議,並對103-104年建置的內容規劃如下: 103-104年: 語料庫:發展語料庫平台及工具,包含建置語料庫平台、中文以及中英雙語平行語料處理程式,包括中文分詞、建立索引、統計、分析及檢索的工具。開始公開招標採購並處理書面語語料二億字、中英雙語平行語料二千萬字、口語語料轉寫成文字一千萬字(校對錄音檔、語料標註);舉辦華語教學應用軟體競賽及開放源軟體招標;編纂最常用的500-1,000個中文核心詞彙用法與例句及其英文翻譯。 分級標準:以「現代漢語的書面語和口語平衡語料庫」和「華語文教材資料庫」進行漢字、詞彙、語法及篇章之發展框架與內容編選原則,完成漢字、詞彙、語法點各表之初稿,以及篇章分級標準及範例;進行中文文章和教材難度的可讀性公式;建置資料庫中各類型、各文體教材的分級檢索。 能力指標:統整國內外華語文能力指標之現況,進行聽說分級能力指標之探究與發展,檢視國際在制訂華語文能力指標之標準流程;配合語料庫編撰之501-1,000個中文核心詞彙用法與例句,核對本計畫研發之能力指標檢核重點;並對讀、寫、譯分級能力指標之文獻探究與整體規劃。 在中長期建議方面,105-109年建置的內容規劃如下: 105年: 語料庫:針對已採購的語料,完成中文書面語語料庫字頻、詞頻、關鍵詞上下文語境檢索系統,及搭配語檢索系統,並完成內部測試。持續公開招標採購並處理書面語語料一億字、中英雙語平行語料一千萬字、口語語料轉寫成文字5百萬字(校對錄音檔、語料標註);舉辦華語教學應用軟體競賽及開放源軟體招標;編纂最常用的1,001-1,500個中文核心詞彙用法與例句及其英文翻譯。 分級標準:依據「現代漢語的書面語和口語平衡語料庫」和「華語文教材資料庫」,完成華語文中文教材中篇章、語法、詞彙、漢字提出分級標準和檢定中文文章及華語教材難度的可讀性公式,並進行專家人工調整,進行問卷施測,完成分級檢索系統並完成內部測試。 能力指標:發展與研定共通性華語文讀、寫、譯各級能力指標與總體能力指標,確認華語文聽、說、讀、寫、譯各級能力指標內涵能否搭配分級標準組華語文中文教材中篇章、語法、詞彙、漢字之分級標準;整合語料庫組編纂之最常用的1,001-1,500個中文核心詞彙用法與例句及其英文翻譯。
關鍵字
華語文語料庫建置標準體系建置能力指標分級指標