融合HowNet的中文電子病歷命名實體識別
【摘要】:
中文電子病歷中存在大量非結(jié)構(gòu)化的文本信息,其中的醫(yī)學(xué)命名實體識別是生物醫(yī)學(xué)領(lǐng)域知識組織和服務(wù)的基礎(chǔ)。文章首先分析了中文電子病歷特征的詞語、詞性、語素和詞的組成等語法特征,以及HowNet語義特征;然后,運用CRF模型,提出了基于CRF醫(yī)學(xué)命名實體的識...
問答