Workshop
article
畳み込みニューラルネットワークを用いたコード片からのプログラミング言語識別
Abstract

プログラミング技術に関するナレッジコミュニティとして最も有名なものの一つに Stack Overflow がある. ここでは,プログラミングに関する質問が投稿されると,それに対して回答が寄せられる. 投稿される質問や解答に はしばしば snippet と呼ばれるテキスト片が含まれている.このテキスト片は一般的にはソースコードの断片であり, ソフトウェアにおけるバグやその修正を分析する上で,非常に有用なデータセットとなりうる.しかし,snippet に は目的のプログラミング言語以外で記述されたテキストもしばしば含まれているため,そのままでは正確なデータと して用いることができない.この問題を解決するためには,「snippet がソースコードであるかどうか」,そして,「ど のプログラミング言語によって記述されたソースコードであるかどうか」を識別する必要がある.本報告では,これ らの snippet に対して,畳み込みニューラルネットワークを用いたプログラミング言語の識別方法を提案した. Stack Overflow から取得できるオープンデータを用いた実験より,プログラミング言語の分類,及び,snippet から目的のプ ログラミング言語以外の snippet の除外が可能であることを確認した.
Files

draft
BibTeX

Copyright © 2025 omzn.aquatan.net a.k.a. Osamu Mizuno All rights reserved.

The publications displayed in this list is related to SEL@KIT members only.