2021-04-18 15:52  阅读(64)
文章分类:Java 基础实战 文章标签:JavaJava 教程
©  原文作者:w3cschool 原文地址:https://www.w3cschool.cn/java/java-examples.html

以下实例演示了如何使用 net.URL 类的 URL() 构造函数来抓取网页:

    /*
     author by w3cschool.cn
     Main.java
     */
    
    import java.io.BufferedReader;
    import java.io.BufferedWriter;
    import java.io.FileWriter;
    import java.io.InputStreamReader;
    import java.net.URL;
    
    public class Main {
       public static void main(String[] args) 
       throws Exception {
          URL url = new URL("http://www.w3cschool.cn");
          BufferedReader reader = new BufferedReader
          (new InputStreamReader(url.openStream()));
          BufferedWriter writer = new BufferedWriter
          (new FileWriter("data.html"));
          String line;
          while ((line = reader.readLine()) != null) {
             System.out.println(line);
             writer.write(line);
             writer.newLine();
          }
          reader.close();
          writer.close();
       }
    }
    

以上代码运行输出结果为(网页的源代码,存储在当前目录下的 data.html 文件中):

    <!DOCTYPE html> <html> <head> <meta charset="UTF-8"/> <meta http-equiv="X-UA-Compatible" content="IE=11,IE=10,IE=9,IE=8"/>……
    
点赞(0)
版权归原创作者所有,任何形式转载请联系作者; Java 技术驿站 >> Java 实例 – 网页抓取
上一篇
Java 实例 – 线程挂起
下一篇
Java 实例 – 获取 URL响应头的日期信息