Python新闻数据提取与处理
项目概述
本项目使用Python和News API提取与特定关键词相关的新闻数据,并进行数据清理和转换。
关键词
- 加拿大
- 大学
- 蒙克顿
- 哈利法克斯
- 多伦多
- 温哥华
- 艾伯塔省
- 尼亚加拉
技术栈
- Python
- News API
文件说明
news_extraction.py
: 包含 API 设置、新闻数据提取和数据清理过程的 Python 脚本。news_data_cleaned.json
: 包含根据目标关键字提取并清理后的新闻数据的 JSON 文件。
数据清理
对提取的新闻数据进行了清理,包括去除表情符号和象形文字等。