關鍵詞:新hsk大綱 等級類推 詞法知識庫 相對熵
摘要:HSK是一項國際漢語能力標準化考試。新HSK大綱中附表所列650個“默認詞”多依據專家知識人工列舉式的擴充。該文在《現代漢語詞典》《現代漢語語法信息詞典》等資源的基礎上,利用知識工程的方法,迭代使用減字默認、組合默認等詞匯等級類推規則,力爭實現類推過程中隱性知識的顯性化、分散知識的系統化,使得詞匯等級類推的每一個環節都有章可循、有據可依,完成了基于新HSK大綱詞匯等級的系統類推工作。接著,結合所構建的漢語詞法知識庫對類推結果進行了篩選,最終得到了23 762個詞語的類推等級。最后,通過對類推結果的統計分析,表明該文的研究工作可以更好地發揮新HSK詞匯大綱在漢語詞匯定級、文本難度分級中的指導作用,也可為其他領域教學詞匯大綱的制定提供一定的借鑒。
中文信息學報雜志要求:
{1}本刊對刊發的文章擁有版權,不得擅自轉載、改編。凡轉載、改編務經我刊同意,違者必究。
{2}作者簡介包括:姓名、性別、出生年月、畢業學校及所學專業、工作單位、職務職稱、現從事的研究工作情況。
{3}來稿若屬國家自然科學基金項目或省部基金項目,請在文稿中標明其基金來源和編號,我刊可以優先審核發表。
{4}正文內連續敘述中的序號采用①……;②……;③……。分級超過3級后用網括號如:“①”,“②”表示,并采用連排。
{5}附注請一律使用當頁腳注的形式,以帶圈①……⑩的方式編號,使用每頁重新編號的方式。
注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社