IT導入補助金の記事を、形態素解析でキーワードの出現頻度の多い順に分析

中小企業診断士のIT研究会、PIT では、2月定例会のテーマは、Pythonでした。

Pythonは「少ないコード量(文量)で簡単にプログラムがかける」「コードが読みやすい」といったメリットのある素晴らしい言語で、今話題の人工知能(AI)やWeb開発など広い分野で使われていて「これさえあればなんでも作れてしまうのでは?」そう思うぐらい様々なことができるオールラウンドな言語なんです
というのが本当なのか、みんなで体験してきました・・・
みんなで開発環境の設定からスタートなので、時間がかかりましたが、
「記事を読み込んで、出現頻度の多い情報を出力する!というのをやりました」
自分が書いたIT導入補助金の記事(6000文字程度)を分析してみると・・・
確かに、採択されるためには、○○が必要
自社で計画を作ることが必要
みたいなことを色々書いた気がします(^^;
Pythonの総合開発環境RODEOをインストールして、
janomeというパッケージで 形態素解析して
wordcloudというパッケージでグラフィカルな表示にされました。
色々プログラム慣れしていないので、難しいですが、出力結果を見ると楽しいですね。
そんなところで

PR

PVアクセスランキング にほんブログ村

PIT

Posted by tomoyamurakami