### Twitterログ分析 作業手順書 **1. 準備作業:ログファイルの分割** 1. **ZIPファイル内データの直接処理:** * Pythonの`zipfile`モジュールを使い、`twitter-....zip`を展開せずに直接開く。 2. **JSONの逐次読み込みと分割:** * ZIPアーカイブ内のJSONファイル(ファイル名は要確認)をストリームとして読み込み、ツイートを一件ずつ処理する。 * ツイートの日時(`created_at`)を元に、1年ごとのJSONファイル(例: `tweets_2020.json`)に分割して書き出す。 * この方法で、巨大なファイルをディスクに展開することを避ける。 **2. データ分析:年次サマリーの作成** 1. **年次データの分析:** * 年ごとのJSONファイルから、以下の情報を抽出・分析する。 * **活動量:** * 年間総ツイート数 * 1日あたりの平均ツイート数 * **活動時間:** * ツイートが最も多い時間帯、曜日 * **交流:** * メンションを最も多く送ったアカウントTOP3 * メンションを最も多く受け取ったアカウントTOP3 * **感情分析:** * その年のツイート全体の感情傾向(ポジティブ/ネガティブ、怒りなど)を分析する。 2. **サマリーの出力:** * 分析結果を年ごとにテキストファイル(例: `summary_2020.txt`)として保存する。 **3. 総合評価:17年間の変化をたどる** 1. **長期的傾向の分析:** * 年次サマリーを元に、17年間を通した変化を可視化・分析する。 * **トピックの変化:** 「病気」「仕事」に関するツイートが、年々増えたか・減ったか。 * **感情の変化:** 「怒り」などのネガティブな感情が、時間と共にどう変化したか。 * **関心の変化:** 言及したニュース記事(URL)の傾向を追う。 2. **最終レポート作成:** * すべての分析結果から「田上君がTwitterと共にどう変化していったか」をテーマに、最終的なレポートを作成する。