立法院

【研究紀要】文本分析的基礎建設:臺灣國會研究詞庫的建置與測試

近年來,越來越多政治學者利用自然語言處理(Natural Language Processing)的技術,進行國會文本主題分類或是判別立場、情感和語意,節省人工過錄的成本。臺灣的國會是世界上唯一使用中文的民主國會,對於比較國會研究和中文文本分析的發展都至關重要。然而,在國會中使用的許多詞彙,並非一般常用的詞彙,而目前既有的中文斷詞系統不見得能區辨這些詞彙。斷詞的錯誤可能造成詞彙機率的估算偏誤,進而影響研究結果的信度與效度。本研究提出一個針對臺灣國會研究建置的斷詞詞庫(Lexicon for Taiwan Legislative Studies,以下簡稱:LTLS),蒐集約 13 萬 7 千個立法和政治相關詞彙。此外,本研究史無前例地同時評測了結巴(Jieba)、中央研究院 CKIP 以及 Articut 這三個臺灣較常使用的斷詞系統在面對國會文本的斷詞表現。我以這些系統分別在搭配與未搭配 LTLS 的情形下對立法院第 7 屆至第 9 屆(2008 ∼ 2020)口頭總質詢文本斷詞,進行主題模型分析,並同時以人工過錄文本主題,再評測何種斷詞方式更能使研究結果接近人工過錄。

立法院積極議程設定之理論與經驗分析:第二至第六屆

當前用於解釋美國國會立法過程的立法理論,皆假定立法機構中存在一多數黨,且無法對多數黨在黨內同質性與黨際分化程度發生變動時的積極議程設定權提出明確的預測。針對僅有單一立法樞紐(即多數黨或聯盟)的台灣立法院,本文提出一個積極議程設定理論模型,解釋此立法樞紐在不同條件下的積極議程設定權與立法成功。本文預測多數聯盟施展積極議程設定權的能力會受到提案推動成本(例如聯盟席次大小、單一政黨或多黨組成多數聯盟)與提案優先性的影響。這些由本文模型推導出的假設,在過去的研究中皆未曾被提出。為了更嚴謹檢驗這些假設並獲得更穩固的經驗分析結果,我們蒐集第二至第六屆(1993-2007)所有的立法提案。本文的假設在經驗分析與質性探討中獲得很高程度的支持,顯示出多數聯盟的積極議程設定權相當程度上受到協商成本與提案優先性的影響。此外,有別於過去的經驗分析結果,本文發現分立政府並未對行政院提案通過與否造成不利的影響。這些結果對於我們在理解台灣立法僵局與行政立法關係上有很大啟示,同時也推翻過去對藍綠無法共治的刻板印象。

選制改變前選區規模對立委分配政策提案行為的影響

由於第七屆立法委員選舉制度改為單一選區兩票制並將員額減半,本研究觀察第六屆區域立委在分配政策提案行為上,是否會因為選制的即將改變而產生變化?並與第五屆區域立委截然不同?變化幅度是否會隨著選區規模的不同而有所差異?本研究發現第五屆大型及中型選區立委的分配政策提案數量皆遠低於小型選區立委,其中又以大型選區立委的分配政策提案數量最少,代表選區規模越大,立委越沒有動機提出分配政策提案。而在第六屆立法院時期,大、中、小型選區立委之間的分配政策提案數量卻沒有顯著的差異。出現這種現象主要是因為第六屆的中、大型選區立委在分配政策提案的數量上大幅地成長,顯著地多過於第五屆的中、大型選區立委。而小型選區立委的分配政策提案數量在五、六兩屆立法院之間並沒有顯著性的差異。這意味著來自選區規模越大的區域立委,受到選制即將改變為單一選區與員額減少的影響也越深遠。本研究不但發現選區規模對於台灣立法委員分配政策提案行為的顯著影響,同時也觀察到選舉制度即將改變之前就已經對國會議員分配政策提案行為產生影響。

Subscribe to RSS - 立法院