重音(Stress)

  • 輸入

    • 有詞性、斷詞的漢語母語語句

  • 輸出

    • 每個字的聲調

\subsection{變調佮重音預測} \label{小節:變調佮重音預測} 佇書寫的音標佮實際唸的發音定定是無仝款的, 上大的差別就是聲調(Tone)佮重音(Stress)。 漢語有聲調, 聲調到發音之間會變調(Tone Sandhi)。 南島語有重音, 標註語句的重音(Stress Prediction)嘛是一个音韻學的研究問題。

用閩南語做例, 準做想欲共閩南語的音標變做閩南語的聲音, 毋過實際的音標到唸的發音閣無仝, 後且閩南語的變調傷過複雜的, 需要專門的處理。

楊允言教授就有做過閩南語的變調系統\cite{iunn:台語變調系統實作研究}, 用斷詞、詞性佮句型的資訊, 配合20類音韻規則來變調, 得著88.90%的準確率。 音韻規則的優點是語料無蓋濟的時, 就會當得著八九成的正確率, 毋過若數量一濟, 規則的先後會較歹處理。

變調嘛會當用分類器來做, 共規則式用著的特徵當做參數下入去, 看佗一个分類模型會較好。 伊上大的好處就是管理方便, 拄著新語料,重訓練模型就好矣, 缺點是訓練資料需要誠濟。