这份数据集包含了从普渡大学8位UNIX计算机用户的tcsh(1)历史文件中提取的、经过解析和清理的数据,涵盖了长达2年的时间。数据已经过清理,删除了文件名、用户名、目录结构、网址、主机名等可能识别的信息,保留了命令名称、标志和shell元字符。每个shell会话前后都插入了SOF和EOF标记,并且按日期顺序串联了会话。数据中不包含时间戳。例如,两个会话: