blog,blog,blog blog,blog,blog

blog,blog,blog

目录
kettle处理xml格式数据
/  

kettle处理xml格式数据

1.需求

需要将数据库中代表用户的教育经历,培训经历,工作经历的CLOB类型XML格式的数据拆分为多条数据记录保存在记录教育经历、培训经历、工作经历的表中。
XML格式样例

<?xml version="1.0" encoding="UTF-8"?>
<p0e1r2s3o4n>
    <e0d1u2s>
        <e0d1u e0d1u2i3d="472943" e0d1u2s3t4a="2003-9" e0d1u2e3n4d="2007-6" d0e1g2r3e4e="30" e0d1u2n3a4m5e="**信息学院" e0d1u2s3p4e="通信技术">本专业主要从事通讯类产品的维护与设计。</e0d1u>
    </e0d1u2s>
    <t0r1a2i3n4s>
        <t0r1a2i3n t0r1a2i3n4i5d="472947" t0r1a2s3t4a="2005-05-01" t0r1a2e3n4d="2007-01-10" t0r1a2s3p4e="手机维护,电子类" c0e1r2t="" t0r1a2n3a4m5e="学校实习">2005年5月通过学校常用仪器的识别和常用仪器的使用的实训。
2005年10月通过学校焊锡技术操作的实训。
2006年5月通过学校电视机整机培训的实训,并通过了无线电调试工的考试。
2007年1月至5月 长沙***有限公司 理财顾问 香港**投资有限公司长沙***投资有限公司 外汇投资
</t0r1a2i3n>
    </t0r1a2i3n4s>
    <e0x1p2s>
        <e0x1p eexsptiad="472949" e0x1p2s3t4a="2006-11" e0x1p2e3n4d="2007-8" e0x1p2p3o4s="新闻编辑, 投资顾问" e0x1p2c3o4m="***人民广播电台卫星频道 联合证券**分公司 " e0x1p2a3c4t="1"></e0x1p>
    </e0x1p2s>
</p0e1r2s3o4n>

2.执行

2.1 过滤掉不包含目标XML标签的数据

20191221203002.png

比如培训经历标签< t0r1a2i3n4s>
20191221203743.png

2.2 解析XML数据

20191221203743.png

将样例XML数据粘贴到解析

20191221203743.png

20191221203743.png

20191221203743.png

20191221203743.png

20191221203743.png

20191221203743.png

XML路径支持Xpath语法

20191221203743.png

3.最后结果

20191221203743.png

20191221203743.png
20191221203743.png