- 数据探索:相关性分析、预处理
- 特征工程:缺失值处理、类型处理、特征提取、模型选择
- 模型构建与融合:搭建LR、RF、GBDT、AdaBoost、DecisionTree、KNN、SVM、XGBoost模型并优化参数
泰坦尼克船员救助分析
相关推荐
泰坦尼克号生存预测解析
这份资源提供了对泰坦尼克号乘客生存的预测,并附带详细解答。通过分析各种因素,例如乘客舱位、年龄、性别等,可以揭示哪些因素对乘客的生存起到了关键作用。
数据挖掘
2
2024-05-15
Kaggle泰坦尼克号数据科学挑战
Kaggle泰坦尼克号数据科学挑战是一个基于Kaggle平台的数据科学项目,利用泰坦尼克号乘客的数据进行生存情况预测。这个项目提供了包括乘客ID、生存情况、社会经济阶层、姓名、性别、年龄、兄弟姐妹及配偶数量、父母及子女数量、船票编号、船票费用、客舱号码以及登船港口等多个关键特征。数据科学家们可以利用这些数据进行分类任务的机器学习模型训练和优化。
算法与数据结构
0
2024-08-29
泰坦尼克号生存预测数据集详解
该数据集包含训练集和测试集,共计1200多条数据,涵盖乘客年龄、性别、船舱等信息,可供数据挖掘和分析使用。
算法与数据结构
1
2024-07-13
泰坦尼克号数据集深度学习与Kaggle挑战
在大数据和机器学习领域,经典的数据集通常提供了丰富的学习资源。\"titanictraindata.zip\"是一个典型的例子,包含了Kaggle上的泰坦尼克号数据。压缩包内核心文件\"titanictraindata.csv\"详细记录了泰坦尼克号上乘客的信息,为研究者提供了实践平台。这一历史事件的数据挑战吸引了全球的数据科学家和机器学习爱好者,参与者需要预测乘客在泰坦尼克号沉没时的生存情况。数据集包括PassengerId、Survived、Pclass、Name、Sex、Age、SibSp、Parch、Ticket、Fare、Cabin和Embarked等字段,分析这些数据可以揭示生存率背后的因素和关联。数据预处理和多种建模算法如逻辑回归、决策树、随机森林等是参赛者需要掌握的重要技能。
算法与数据结构
1
2024-07-16
泰坦尼克号乘客数据集的修改版
本资源对传统泰坦尼克号数据集进行了修改:将乘客姓名中的逗号替换为空格,删除了船舱信息,并按照顺序列出了乘客编号、获救情况、乘客等级、姓名、性别、年龄、兄妹个数、父母与小孩个数、船票信息。读者可以自行添加表头字段。
Hadoop
0
2024-08-04
使用泰坦尼克号数据集的统计分析预测乘客存活率
利用泰坦尼克号数据集,通过统计分析对乘客存活率进行预测。分析基于 Python 脚本,需要在 CSV 文件夹中提供 train.csv 和 test.csv 文件,可从指定的 URL 下载。
统计分析
1
2024-06-01
泰坦尼克号乘客生存预测数据集:机器学习决策树应用
该数据集用于机器学习决策树模型,特别是针对泰坦尼克号乘客生存预测的案例。通过分析乘客的年龄、性别、票价等特征,构建决策树模型,预测他们在灾难中的生存情况。
算法与数据结构
6
2024-04-29
泰坦尼克号乘客生存预测:决策树、支持向量机与随机森林模型比较
1912年泰坦尼克号的沉没事故中,乘客的生存率并非完全随机。 女性、儿童以及上层阶级乘客拥有更高的生存概率。 通过机器学习方法,例如决策树、支持向量机和随机森林,我们可以分析泰坦尼克号数据集,探索不同因素对乘客生存的影响,并构建预测模型。
算法与数据结构
6
2024-05-23
泰坦核心库
泰坦核心库:Titan 数据库的核心库。
NoSQL
5
2024-04-30