Java 中调用 Python 爬虫有两种方法:使用 subprocess 或 os 模块直接运行 Python 脚本。将 Python 爬虫部署为 Web 服务,通过 HTTP 请求调用。
Python 爬虫如何由 Java 调用
直接调用
import java.io.IOException; public class CallPythonCrawler { public static void main(String[] args) throws IOException { // 替换为 Python 爬虫脚本的路径 String pythonScriptPath = "/path/to/python_crawler.py"; // 根据需要传递参数 String[] arguments = {"arg1", "arg2"}; // 运行 Python 爬虫 ProcessBuilder processBuilder = new ProcessBuilder("python", pythonScriptPath, arguments); Process process = processBuilder.start(); // 获取爬虫输出 String output = process.getInputStream().toString(); // 处理输出 // ... } }
通过 HTTP 请求调用
import java.io.BufferedReader; import java.io.InputStreamReader; import java.net.HttpURLConnection; import java.net.URL; public class CallPythonCrawlerViaHTTP { public static void main(String[] args) throws Exception { // 替换为 Python 爬虫服务的 URL String url = "http://localhost:8080/crawl"; // 创建 HTTP 请求连接 URL obj = new URL(url); HttpURLConnection con = (HttpURLConnection) obj.openConnection(); // 发送请求 con.setRequestMethod("POST"); con.setRequestProperty("Content-Type", "application/json"); // 根据需要添加查询参数或 JSON 负载 // 获取响应 BufferedReader in = new BufferedReader(new InputStreamReader(con.getInputStream())); String output = in.readLine(); // 处理输出 // ... } }
注意事项
立即学习“Java免费学习笔记(深入)”;
以上就是python爬虫java怎么调用的详细内容,更多请关注php中文网其它相关文章!
java怎么学习?java怎么入门?java在哪学?java怎么学才快?不用担心,这里为大家提供了java速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号