`
codespace
  • 浏览: 26357 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

保存html源文件到txt

    博客分类:
  • java
阅读更多
import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStreamReader;
import java.net.MalformedURLException;
import java.net.URL;

public class ReadUrlToTxt {
	private URL url = null;

	public ReadUrlToTxt() {
		try {
			init();
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
	}

	private void init() throws IOException {
		java.util.Scanner sc = new java.util.Scanner(System.in);
		System.out.println("please enter a url");
		String strUrl = sc.next();
		try {
			url = new URL(strUrl);
		} catch (MalformedURLException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		}
		BufferedReader input = new BufferedReader(new InputStreamReader(url
				.openStream()));
		saveHtmlToTxt(input);

	}

	private void saveHtmlToTxt(BufferedReader input) {
		java.util.Scanner sc = new java.util.Scanner(System.in);
		String str;
		String path;
		System.out.println("please enter the file path you want to save");
		path = sc.next();
		FileOutputStream output = null;
		try {
			output = new FileOutputStream(path);
		} catch (FileNotFoundException e1) {
			// TODO Auto-generated catch block
			e1.printStackTrace();
		}
		try {
			while ((str = input.readLine()) != null) {
				byte[] byteStr = str.getBytes();
				output.write(byteStr);

			}
		} catch (IOException e) {
			// TODO Auto-generated catch block
			e.printStackTrace();
		} finally {
			try {
				output.close();
			} catch (IOException e) {
				// TODO Auto-generated catch block
				e.printStackTrace();
			}
		}

	}

	/**
	 * @param args
	 */
	public static void main(String[] args) {
		// TODO Auto-generated method stub
		new ReadUrlToTxt();

	}

}


分享到:
评论

相关推荐

    6种常见电子书转换成TXT的软件

    选中欲转换的文件,单击工具栏上的“添加文件”按钮,即会在右上方的窗口中列出等待转换的文件,添加完成后,单击齿轮形状的“转换”按钮,即可完成转换,转换好的TXT文件保存在源文件所在文件夹内。 4 JAR转TXT ...

    电子书格式转换为txt大全

    选中欲转换的文件,单击工具栏上的“添加文件”按钮,即会在右上方的窗口中列出等待转换的文件,添加完成后,单击齿轮形状的“转换”按钮,即可完成转换,转换好的TXT文件保存在源文件所在文件夹内。 4 JAR转TXT ...

    网页源文件中的汉字提取

    在寻找资源的时候偶尔要通过网页源文件来复制我们需要的文字,但是这时肯定又很多HTML格式。把相关内容复制保存到“3.txt”运行小程序可以去除格式,提取网页源文件中的汉字

    不重复随机点名程序及源文件

    这是使用Python3.6编写的一个不重复随机点名的程序,有图形界面,可以用在课堂上和联谊...使用方法:打开文件夹→dist→name1.txt→录入名单(注意:每个名字为一行)→保存关闭文本文档→双击运行dm.exe即可开始点名。

    网管教程 从入门到精通软件篇.txt

    网管教程 从入门到精通软件篇 ★一。★详细的xp修复控制台命令和用法!!! 放入xp(2000)的光盘,安装时候选R,修复! Windows XP(包括 Windows 2000)的控制台命令是在系统出现一些意外情况下的一种非常有效的...

    一个简单的编辑器 实现文本的编辑

    此编辑器能实现打开,编辑,和保存 html,java,cpp,txt 文件。还支持Java源文件的编译和运行

    Linux运维常用命令.doc

    * 硬链接文件:删除源文件后仍然可用,仅适用于文件,保存位置必须与源文件在同一个文件系统中。 cp 命令 cp 命令用于将需要复制的文件或目录(源)重建一份,并保存为新的文件或目录。常用选项包括: * -f:覆盖...

    Java实现一个简单的编辑器

    简单编辑器,可打开、编辑和保存HTML、Java、cpp、txt文件,能在文件中查找替换,支持Java源文件编辑和运行。

    JAVA上百实例源码以及开源项目源代码

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    如何将PPT转word

    PDF是Adobe公司开发的作为全世界可移植电子文档的通用格式,它能够正确保存源文件的字体、格式、颜色和图片,使文件的交流可以轻易跨越应用程序和系统平台的限制。但是,一些文档的特殊操作(如提取PDF文档中的一段...

    梦想新闻发布系统-正式版

    单独运行或者与Apache集成都行(我用的是Tomcat + Apache)复制本程序到你服务器的根目录下,我用的Tomcat,默认路径为:Tomcat安装目录/webapps/ 目录下。请保证系统的目录名为news,如果更改了系统的目录名,请系统...

    VC++基于winsock的邮件发送接收系统毕业设计

    1、软件目录 ...(2)将MailSystemServer(除源文件外)和MailSystemClient目录拷贝到你的php服务器某个目录 (3)运行pop3服务器和smtp服务器 (4)登陆MailSystemClient/index.php客户端首页开始收发邮件

    FreeRTOS内核应用开发.pdf

    * src 文件夹用于保存 FreeRTOS 中的核心源文件,也就是我们常说的‘.c 文件’。 * port 文件夹用于保存内存管理以及处理器架构相关代码。 五、FreeRTOS 内核应用开发 * FreeRTOS 是一个软件,单片机是一个硬件,...

    JAVA实战项目源码-计算机毕业设计java专业-java开发初学者使用文本编辑器

    本文本编辑器的设计,能打开,编辑和保存html,java,cpp,txt文件,能够在文件中进行查找和替换,而且支持java源文件的编译与运行,前提是机器上已经安装了java虚拟机并配置好了java相关的环境变量。 此文本编辑器是集...

    cmd操作命令和linux命令大全收集

    fc one.txt two.txt > 3st.txt 对比二个文件并把不同之处输出到3st.txt文件中,"> "和"> >" 是重定向命令 at id号 开启已注册的某个计划任务 at /delete 停止所有计划任务,用参数/yes则不需要确认就直接停止 at ...

    rar压缩软件.rar

    保存在配置文件中的开关 最低优先级 日志文件 ~~~~~~~~ 如果在命令行或配置文件中指定开关 -ilog ,RAR 将会把处理压缩文件中遇到的错误 等写到日志文件中。读取开关 -ilog 描述获得更多信息。 固实压缩...

    office在线查看

    //保存缓冲输出结果 StringBuilder buf = new StringBuilder(); String line = null; try { line = br.readLine(); } catch (IOException e) { e.printStackTrace(); } //循环等待进程结束 while(line != ...

    java源码包---java 源码 大量 实例

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    java源码包2

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

    java源码包3

     Java实现HTTP连接与浏览,Java源码下载,输入html文件地址或网址,显示页面和HTML源文件,一步步的实现过程请下载本实例的Java源码,代码中包括丰富的注释,对学习有帮助。 Java实现的FTP连接与数据浏览程序 1个...

Global site tag (gtag.js) - Google Analytics