微信公众号讲师中心

首页

文章

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程自媒体新闻

专题

后端开发 web前端数据库开发工具 php框架科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程新闻

AI工具

AI 聊天问答 Agent智能体 AI 文本写作 AI 绘画作图 AI 设计工具 AI 视频创作 AI 音频制作 AI 办公学习 AI 编程开发 Prompt指令

学习

大前端后端开发数据库移动端运维开发计算机基础

编程手册

大前端后端开发数据库移动端运维开发计算机基础

下载

js特效网站源码工具下载类库下载网站素材学习资源插件扩展手机/移动开发手机游戏

搜索

后端开发 web前端数据库开发工具 php框架常见问题科技 Java 系统教程电脑教程硬件教程手机教程软件教程游戏教程

首页 > web前端 > html教程 > 正文

如何用BeautifulSoup从嵌套div和span标签的HTML中提取表格数据？

心靈之曲

发布： 2025-02-21 12:22:01

原创

740人浏览过

如何用BeautifulSoup从嵌套div和span标签的HTML中提取表格数据？

本文演示如何利用beautifulsoup库从包含嵌套div和span标签的html代码中提取表格数据。beautifulsoup是一个强大的库，用于解析和处理xml和html文档。

以下步骤将指导您如何使用BeautifulSoup实现这一目标：

<code class="python">from bs4 import BeautifulSoup
import pandas as pd

html = """
<div class="all hs_list" id="articlelistnew">
    <div class="dheader">
        <span>阅读</span><span>评论</span><span>标题</span>
        <span>作者</span>
                            <span>最后更新</span>
    </div>
    <div class="articleh normal_post">
        <span>471</span>
        <span>2</span>
        <span>...</span>
        <span>...</span>
        <span>09-12 00:09</span>
    </div>
    <div class="articleh normal_post">
        <span>603</span>
        <span>3</span>
        <span>...</span>
        <span>...</span>
        <span>09-11 16:01</span>
   </div>
</div>
"""

soup = BeautifulSoup(html, 'html.parser')

# 获取表头
headers = [th.text.strip() for th in soup.select("div.dheader span")]

# 获取表格数据行
rows = [[td.text.strip() for td in row.select("span")] for row in soup.select("div.articleh")]

# 创建Pandas DataFrame
df = pd.DataFrame(rows, columns=headers)

# 打印DataFrame
print(df)</code>

登录后复制

这段代码首先使用BeautifulSoup解析HTML，然后利用select方法分别提取表头和数据行。 text.strip()用于去除多余的空格。最后，使用pandas库将数据转换成易于阅读和操作的DataFrame格式并打印输出。请注意，此示例假设表格数据都包含在<span></span>标签中。如果HTML结构不同，需要相应调整select方法的选择器。

慧中标AI标书

慧中标AI标书

慧中标AI标书是一款AI智能辅助写标书工具。

慧中标AI标书

120

慧中标AI标书

以上就是如何用BeautifulSoup从嵌套div和span标签的HTML中提取表格数据？的详细内容，更多请关注php中文网其它相关文章！

相关标签：

html beautifulsoup pandas select xml 选择器

HTML速学教程(入门课程)

HTML速学教程(入门课程)

HTML怎么学习？HTML怎么入门？HTML在哪学？HTML怎么学才快？不用担心，这里为大家提供了HTML速学教程(入门课程)，有需要的小伙伴保存下载就能学习啦！

来源：php中文网

上一篇：指针与数组操作失误：为何代码输出62345而非23456？下一篇：IntersectionObserver的rootMargin属性为何在root为视口时失效？

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

最新问题

HTML5代码如何实现文件上传 HTML5代码中File API的运用解析使用FileAPI可实现文件读取与上传，通过input选择文件，FileReader读取内容并预览；2.支持图片预览、多文件处理及FormData异步上传。

2025-11-12 22:57:17

965

如何解决Vim HTML插件冲突的处理方法首先确认冲突插件，如html5.vim与vim-polyglot；通过注释、:scriptnames和:verbosesetfiletype?排查；使用插件管理器控制加载顺序，如先载入vim-polyglot再加载emmet-vim；禁用重复功能，如设置g:polyglot_disabled=[‘html’]；通过autocmd按需加载并清除冗余映射，确保各插件协同工作。

2025-11-12 22:55:10

967

前台html如何显示_前端HTML页面显示与渲染优化方法优化前端HTML渲染需缩短关键渲染路径，内联核心CSS、移除冗余代码、延迟非关键JS；预加载重要资源；简化DOM结构；压缩合并文件；使用高效CSS选择器；懒加载非首屏内容。

2025-11-12 22:52:02

451

html5怎么上传图片显示_HTML5图片预览与上传实现使用input[type=file]选择图片，通过FileReader读取文件并预览；2.将文件转为base64显示在img标签中；3.用FormData和fetch将文件上传至服务器；4.可添加文件校验、多图上传和样式优化提升体验。

2025-11-12 22:49:02

535

html头部链接怎么打_html头部链接如何打专业教程头部链接用于引入CSS、favicon、预加载资源等；2.使用标签设置rel属性实现不同功能；3.正确路径与属性配置确保资源正常加载与性能优化。

2025-11-12 22:39:02

637

html源码如何保存为静态网页_html源码保存为静态网页的方法首先将HTML源码保存为.html文件，可通过文本编辑器、浏览器开发者工具、另存为功能或命令行工具实现，确保文件正确命名并包含所有资源。

2025-11-12 22:33:02

131

html模板转换器_html模板转换网页版平台答案：https://www.htmleasyconvert.com是一个在线HTML模板转换平台，支持将静态HTML转为响应式网页，提供可视化编辑、多设备适配、一键导出代码包及批量处理功能，无需安装软件即可在线操作。

2025-11-12 22:27:02

298

HTML5在线如何优化页面加载速度 HTML5在线性能提升的实用策略压缩合并CSS、JS和图片，减少资源体积与HTTP请求；2.启用Gzip/Brotli压缩及WebP格式，提升传输效率；3.使用懒加载与响应式图片优化图像加载；4.设置缓存头、ServiceWorker和本地存储增强缓存；5.减少DOM操作、使用CSS3动画和requestAnimationFrame优化渲染。

2025-11-12 22:25:02

1002

如何使用HTML构建新闻列表页面的详细教程神舟二十号因太空碎片撞击推迟返回，中国航天从容应对。太空碎片威胁巨大，而中国早已为此做好长期准备，展现了成熟的太空应急能力。

2025-11-12 22:23:08

130

如何通过HTML5 Figure元素标注图片的详细步骤答案：使用figure元素标注独立内容并配合figcaption添加说明。1.用figure包裹img表示独立内容；2.在figure内添加figcaption描述图片，通常置于下方；3.确保img有alt属性，figcaption补充而非重复alt文本，避免放置装饰性图片；4.可为figure添加class或id以便CSS样式控制，提升可访问性和结构清晰度。

2025-11-12 22:07:36

776

相关专题

更多>

热门推荐

HTML速学教程(入门课程)

开源免费商场系统

广告

热门教程

更多>

相关推荐

热门推荐

最新课程

最新下载

更多>

网站特效

网站源码

网站素材

前端模板

关于我们免责申明举报中心意见反馈讲师合作广告合作最新更新 English: php中文网：公益在线php培训，帮助PHP学习者快速成长！; 关注服务号技术交流群

PHP中文网订阅号: 每天精选资源文章推送

PHP中文网APP: 随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号

PHP学习

技术支持

返回顶部