在浏览器中轻松运行Python程序

碧海醫心
发布: 2024-12-28 21:54:01
原创
1286人浏览过

微软开源的markitdown项目,将office文件转换为markdown格式,迅速成为github热门项目。但其python程序特性限制了非技术用户的易用性。本文介绍如何利用webassembly技术,结合pyodide在浏览器中直接运行markitdown,解决这一问题。

Pyodide是一个将Cpython移植到WebAssembly/Emscripten的开源项目,支持所有Python语法,并允许使用micropip在浏览器中安装和管理Python包,包括许多带有C扩展的常用包(如regex、pyyaml、lxml、numpy、pandas等)。Pyodide还提供强大的JavaScript⟺Python外部函数接口,实现两种语言的无缝衔接。

在浏览器环境中运行MarkItDown面临两个主要挑战:文件传输和依赖安装。

挑战与解决方案:

  1. 文件传输: 通过将用户选择的文件传递到Worker中的Python运行时解决。

    立即学习Python免费学习笔记(深入)”;

  2. 依赖安装: 由于中国大陆对PyPI访问的限制,需要寻找替代方案,例如使用自定义的PyPI镜像。

最终,我们成功构建了一个完全在浏览器中运行的MarkItDown工具,可在office file to markdown体验。

以下是在Worker中运行Python的核心代码:

// eslint-disable-next-line no-undef
importScripts('https://testingcf.jsdelivr.net/pyodide/v0.26.4/full/pyodide.js')


async function loadPyodideAndPackages() {
  // eslint-disable-next-line no-undef
  const pyodide = await loadPyodide()
  globalThis.pyodide = pyodide

  await pyodide.loadPackage('micropip')

  const micropip = pyodide.pyimport('micropip')

  // micropip.set_index_urls([
  // 'https://pypi.your.domains/pypi/simple',  
  // ])

  await micropip.install('markitdown==0.0.1a2')
}

const pyodideReadyPromise = loadPyodideAndPackages()

globalThis.onmessage = async (event) => {
  await pyodideReadyPromise

  const file = event.data
  try {
    console.log('file', file)
    const startTime = Date.now()
    globalThis.pyodide.FS.writeFile(`/${file.filename}`, file.buffer)

    await globalThis.pyodide.runPythonAsync(`
from markitdown import MarkItDown

markitdown = MarkItDown()

result = markitdown.convert("/${file.filename}")
print(result.text_content)

with open("/${file.filename}.md", "w") as file:
  file.write(result.text_content)
`)
    globalThis.postMessage({
      filename: `${file.filename}.md`,
      content: globalThis.pyodide.FS.readFile(`/${file.filename}.md`, { encoding: 'utf8' }),
      time: Date.now() - startTime,
    })
  }
  catch (error) {
    globalThis.postMessage({ error: error.message || 'convert error', filename: file.filename })
  }
}
登录后复制

在浏览器中轻松运行Python程序

在浏览器中轻松运行Python程序

该方案巧妙地利用了WebAssembly和Pyodide的优势,为非技术用户提供了一个更便捷的Office文件转Markdown工具。 代码注释清晰,易于理解。

以上就是在浏览器中轻松运行Python程序的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习
PHP中文网抖音号
发现有趣的

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号