一、添加Link
在DataStage中,添加Link是连接不同stage的常见操作。添加方法有两种:
1. 右键点击起始stage,然后拖动到目标stage。
2. 将鼠标放置在起始stage的边缘,等待出现小圆圈,再拖动到目标stage。
二、类型转换
类型转换是数据映射中的重要操作。常见的转换方法是在Modify或Transformer stage中使用函数进行类型转换。比如在变长字符串转换为固定长度字符串时,默认会使用null(ASCII 0)字符填充。通过设置环境变量APT_STRING_PADCHAR,可以指定不同的填充字符。
三、PadString函数
PadString函数用于将变长字符串填充到指定长度。要注意,PadString的参数不能为固定长度字符串,需要先将其转化为变长类型。
四、Copy Stage
Copy Stage是占位符,适用于开发中暂时不确定使用哪个stage时。但需注意不要将Force属性设为True,这可能导致运行时无法优化Copy Stage。
五、Schema File
Schema File用于指定meta data,可以通过列定义或schema file来实现。要通过schema file指定meta data,必须勾选runtime column propagation,否则默认使用列定义。
六、NLS System
在使用NLS system时,Schema File必须是UTF-8格式。如果需要转码,可以使用Sequential stage。
七、Server Shared Container
Server Shared Container是在Parallel Jobs开发中使用的模块,可以提高代码重用性和维护性。