Python新闻数据提取与处理

项目概述

本项目使用Python和News API提取与特定关键词相关的新闻数据,并进行数据清理和转换。

关键词

  • 加拿大
  • 大学
  • 蒙克顿
  • 哈利法克斯
  • 多伦多
  • 温哥华
  • 艾伯塔省
  • 尼亚加拉

技术栈

  • Python
  • News API

文件说明

  • news_extraction.py: 包含 API 设置、新闻数据提取和数据清理过程的 Python 脚本。
  • news_data_cleaned.json: 包含根据目标关键字提取并清理后的新闻数据的 JSON 文件。

数据清理

对提取的新闻数据进行了清理,包括去除表情符号和象形文字等。