めうの雑記

備忘録

python

wordcloudで凛として時雨の歌詞を可視化してみた

凛として時雨の歌詞でよく使われる単語を可視化してみた。 歌詞データをスクレイピング -> janomeで分かち書き -> wordcloudで可視化という流れになっている。コード # -*- coding: utf-8 -*- from bs4 import BeautifulSoup import urllib.request as req f…

pythonでCDのタイトルから曲名を取得する 2

やりたかったことについてはこちらを参照。umesann.hatenablog.com 加えて今回はID3タグも編集してみる。 # -*- coding: utf-8 -*- #曲名を取得 from bs4 import BeautifulSoup import urllib.request as req import re import os from natsort import natso…

pythonで価格.comから情報を取得する

# -*- coding: utf-8 -*- from bs4 import BeautifulSoup import urllib.parse import urllib.request as req import re f = open("result.txt", "w") page_list = [1,2,3] def scraping(page_count): print(str(page_count) + "ページ目") url = "https://k…

pythonでCDタイトルから曲名を取得する

ORICON NEWS|最新情報を発信する総合トレンドメディア をスクレイピングしてCDの情報を取得する。 コード # -*- coding: utf-8 -*- #曲名を取得 from natsort import natsorted import os from bs4 import BeautifulSoup import urllib.request as req list…

pythonでNAVITIMEの電車混雑リポートから混み具合を取得する

beautifulsoupを用いたスクレイピングをしてみた。 #-*- coding: utf-8 -*- #混雑状況 from bs4 import BeautifulSoup import urllib.request as req import re url_list = ["https://www.navitime.co.jp/train/00000132/%EF%BC%AA%EF%BC%B2%E4%BA%AC%E8%91%…

pythonで形態素解析

janomeを用いて形態素解析を試してみた。 udemy.benesse.co.jp janomeのインストール $ sudo pip install janome 以下の文章が記述されたテキストファイルを読み込み、形態素解析にかける。 <はてなの最新情報を2001年からお届けしているメールマガジン「週…

random関数

random関数を用いて、簡単なパスワード作成のプログラムを作ってみた。 4桁以上の桁数を指定すると、英数字混ざったパスワードとメモのテキストファイルを作る。 書き込みに関してはwを指定すると上書き、aを指定すると追記される。 random.pyなど、既に同じ…

pycharm導入メモ(linux)

python開発環境「pycharm」の導入。 ダウンロードはこちらから www.jetbrains.com 今回は右の「community」からダウンロード。 解凍後、binフォルダ→pycharm.shから起動 バージョン3.0以上のpythonがインストールされていない場合は、端末で sudo apt-get in…