Thesis
techreport
Java プログラムにおける難解な識別子の抽出と分析
  • February 2026
  • 卒業研究報告書 / 京都工芸繊維大学 工芸科学部 情報工学課程 /
  • No URL available
Abstract

ソースコードの大部分は識別子で出来ており,小さなプログラムでは式からでも内容を理解することができるが,大きなプログラムでは内容を理解するために識別子名が重要である.また,識別子名には略語が広く使用されており,そのような識別子名の理解を助けるために,識別子名に使用される略語を展開するための様々な方法が研究されている.しかし,これらの研究において全ての識別子内の略語が展開できているわけではない. 本研究では,先行研究で利用されている英語辞書と略語辞書,各プログラム内のコメントから作成した辞書を用いて,識別子名で意味の理解が難しいと考えられるものを抽出し,そのような識別子名の命名の理由を調査する.具体的には,対象とする8 つのプログラム内全てのJava のソースコードファイルからツールを用いて,全ての識別子名を抽出する.抽出した識別子名に対して,命名規則に基づいて分解し,分解した要素の1 つでも辞書に含まれていなければ,意味の理解が難しい識別子名として抽出する.さらに,抽出した識別子名に対し,辞書には含まれていない単語を考慮し,Gemini を用いて意味の理解が難しいと考えられる識別子名を分類した.その後,抽出した識別子名の数が少ない3 つのプログラムに対して識別子名の命名の理由を調査した.結果として,抽出された識別子名の多くはツールが誤って抽出した識別子名ではない文字列だった.その他の識別子では,前後のコンテキストから完全な用語を推定可能な識別子や,一般的な略語であるが接頭辞などが原因で意味の理解が難しいと考えられる識別子名として抽出された識別子などがあった.
Files

提出版
BibTeX

Copyright © 2025 omzn.aquatan.net a.k.a. Osamu Mizuno All rights reserved.

The publications displayed in this list is related to SEL@KIT members only.