网站制作制作公司,价格低用英语怎么说,艺术名画网站怎么建设,做网站可以用php之前我们用「表格数据提取」#xff08;https://www.huoyuyan.com/community/detail.html?id396#xff09; 组件抓网页数据很方便#xff0c;今天分享用 「获取多元素信息/属性值」获取数据的方法#xff0c;更灵活适配不同页面。
一、案例功能概述
抓取该网页的蔬菜价…之前我们用「表格数据提取」https://www.huoyuyan.com/community/detail.html?id396 组件抓网页数据很方便今天分享用「获取多元素信息/属性值」获取数据的方法更灵活适配不同页面。一、案例功能概述抓取该网页的蔬菜价格https://www.jnmarket.net/fruitsvegetables/dailyprice/vegprice 包含产品名称、产地、最高价 / 最低价等字段。区别于之前使用「表格数据提取」组件这次咱们用「获取多元素信息/属性值」提取网页元素的 outerHTML再结合 XPath 解析字段 —— 适合表格结构不太规整、但能通过元素路径定位的页面。二、实现的逻辑整个流程是 “初始化→翻页循环→抓元素集合→解析字段→存数据”简单说1、打开浏览器 访问目标网页新建表格存数据2、用 While 循环实现翻页控制 “下一页” 按钮的点击3、抓网页中所有数据行的 outerHTML 集合4、遍历集合用 XPath 提取每个字段的内容5、把字段写入表格最后导出 Excel。三、实现的步骤组件1、打开浏览器选择浏览器类型组件2、浏览网页输入网址URLhttps://www.jnmarket.net/fruitsvegetables/dailyprice/vegprice组件3、表格打开或新建新建空表格用于存储数据组件4、表格数据初始化初始化表格列头组件5、For循环为了演示这里使用For循环限制一下采循环次数。组件5.1、获取多元素信息/属性值获取数据行的元素集合目标元素 XPath/tbody[classn-data-table-tbody]/tr定位网页里的所有数据行)属性选outerHTML把整行的 HTML 内容存下来输出变量list后续遍历使用组件5.2、ForEach循环循环遍历list组件5.2.1-5.2.7 Xpath提取在 ForEach 循环内拖 7 个「XPath 提取」组件对应 7 个字段每个组件参数如下字段XPath 提取的参数设置输出变量产品名称源HTML文本T{{item}}XPath./tr/td[1]属性源代码输出变量产品名称产地源HTML文本T{{item}}XPath./tr/td[2]/span/span属性源代码输出变量产地最高价源HTML文本T{{item}}XPath./tr/td[3]属性源代码输出变量最高价最低价源HTML文本T{{item}}XPath./tr/td[4]属性源代码输出变量最低价参考价源HTML文本T{{item}}XPath./tr/td[5]属性源代码输出变量参考价规格源HTML文本T{{item}}XPath./tr/td[6]属性源代码输出变量规格日期源HTML文本T{{item}}XPath./tr/td[7]属性源代码输出变量日期组件5.2.8、打印日志打印以上输出的结果便于调试诊断[{{产品名称}},{{产地}},{{最高价}},{{最低价}},{{参考价}},{{规格}},{{日期}}]打印出来的结果[!----蒜头,江苏/河南,!----9,!----8,!----8.4,!----箱,!----2025-12-16]组件5.2.9、字符串替换根据上一步打印出来的结果那么使用字符串替换将!----替换成空值替换后样式[蒜头,江苏/河南,9,8,8.4,箱,2025-12-16]组件5.2.10、表格数据写入创建整数变量行索引rowIndex默认是0写入到行写入方式追加列索引0-6指定单行索引{{rowIndex}}组件5.2.11、变量赋值给rowindex做操作行号 1下一行继续写。组件5.3、鼠标/元素点击点击翻页按钮组件6、表格数据导出导出数据到指定路径四、避坑指南在实操中会疑问变量rowindex到底是什么流程为啥能 “认得出” 它对应表格的行其实超简单 ——它不是流程天生认识的 “特殊变量”是自定义的 “行索引标记”通过参数绑定告诉流程这个数对应表格的第几行。咋用分三步步骤1、先告诉它从哪行开始先创建一个变量rowindex自定义的名字你也可以叫hanghao/行号等只要前后统一就行赋值内容0火语言 RPA 的表格行索引从 0 开始0 对应 “表头下方的第一行数据行”。这一步的意思告诉流程 “一开始先把数据写到表格的第 一 行”。步骤2、把rowindex绑定到「表格数据写入」组件的 “行索引” 参数在「表格数据写入」组件里找到 “行索引” 这个参数填入{{rowindex}}T模式下用{{rowindex}}#模式下rowindex。「表格数据写入」组件的 “行索引” 参数是专门用来指定 “要把数据写到表格第几行” 的 —— 咱们把rowindex变量填进去就等于告诉流程“用rowindex这个变量里的数字作为写入的行号”。步骤3、变量赋值每写一行让rowindex1避免覆盖直接写rowindex火语言 RPA 支持自增这一步的意思“写完当前行下一条数据要写到下一行”。完整案例分享: https://www.huoyuyan.com/share.html?keyeyJhdXRvQ29kZSI6IkZhbHNlIiwia2V5IjoiYWI4OTU1NWE0NDg0NDlmNjk4MGU2MjQzMmI1MzYwZWQifQ 提取码: Des8