一、添加Link

在DataStage中,添加Link是连接不同stage的常见操作。添加方法有两种:

1. 右键点击起始stage,然后拖动到目标stage。

2. 将鼠标放置在起始stage的边缘,等待出现小圆圈,再拖动到目标stage。

二、类型转换

类型转换是数据映射中的重要操作。常见的转换方法是在ModifyTransformer stage中使用函数进行类型转换。比如在变长字符串转换为固定长度字符串时,默认会使用null(ASCII 0)字符填充。通过设置环境变量APT_STRING_PADCHAR,可以指定不同的填充字符。

三、PadString函数

PadString函数用于将变长字符串填充到指定长度。要注意,PadString的参数不能为固定长度字符串,需要先将其转化为变长类型。

四、Copy Stage

Copy Stage是占位符,适用于开发中暂时不确定使用哪个stage时。但需注意不要将Force属性设为True,这可能导致运行时无法优化Copy Stage

五、Schema File

Schema File用于指定meta data,可以通过列定义或schema file来实现。要通过schema file指定meta data,必须勾选runtime column propagation,否则默认使用列定义。

六、NLS System

在使用NLS system时,Schema File必须是UTF-8格式。如果需要转码,可以使用Sequential stage

七、Server Shared Container

Server Shared Container是在Parallel Jobs开发中使用的模块,可以提高代码重用性和维护性。