0

0

Java在创建文件时指定编码的实现方法

WBOY

WBOY

发布时间:2022-08-24 09:09:20

|

2884人浏览过

|

来源于脚本之家

转载

本篇文章给大家带来了关于java的相关知识,其中主要介绍了java在创建文件时指定编码的实现方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,希望对大家有帮助。

Java在创建文件时指定编码的实现方法

推荐学习:《java视频教程

前言:最近,学习了Java IO流的相关的知识,想通过读写文件的方式练习和巩固所学知识。在使用File类创建文件时,突然想到,我该如何指定文件使用的编码呢? 进而想到,应该如何查看一个文件的编码呢?

一、问题分析

先去互联网上查找答案,结果如下:

立即学习Java免费学习笔记(深入)”;

FileInputStream fis=new FileInputStream(“xxxx.txt”);
OutputStreamWriter osw=new OutputStreamWriter(fis,“UTF-8”);

上面的代码大概意思是在写入文件时,写入的字符使用UTF-8编码,和我预想的不一样,我想在创建文件的同时指定编码。像下面这样,

File myfile = new File("test.txt”, “UTF-8”);
if (!myfile.exists()) myfile.createNewFile();

于是,我去查看Java API 8官方文档,File没有提供可以指定字符编码的构造函数。

在这里插入图片描述

同时也没提供set或者get等其他访问字符字符编码的方法,说明字符编码不是文件的固有属性。像文件创建时间,文件修改时间,是否可读、可写、可执行,这些都是文件的固有属性,或者说元信息,它们是文件的一部分。

在这里插入图片描述

二、字符编码

我们知道,计算机中存储的任何信息都是01串,文字也不例外。

对于字符的处理包括两个过程:编码和解码编码:把字符"映射“到01串解码:把01串"映射“到字符

不同的字符编码,例如GBK、UTF-8,编码和解码使用的规则不同。

对于同样的文本字符串:“中国”,使用UTF-8编码保存,一般使用三个字节保存一个汉字,(底层的01字符串的16进制形式)。

在这里插入图片描述

使用GBK编码保存,使用两个字节表示一个汉字。

在这里插入图片描述

当我们在文本编辑器中写好文字保存时,编辑器会根据你设置的字符编码类型将文本”映射“成01串。

Mistral AI
Mistral AI

Mistral AI被称为“欧洲版的OpenAI”,也是目前欧洲最强的 LLM 大模型平台

下载

你设置的字符类型,仅仅是编辑器把文字编码成成10串的转换规则而已,并不是文本的属性。

在编辑器打开文本文件时,显示的不是底层的01串,而是文字,是因为编辑器使用某种文字编码,把01串解码为字符。如果,解码时,使用的字符编码和编码时的一致或者兼容,就可以正确显示文本。如果解码时,使用的字符编码和编码时的不一致或者不兼容,就会乱码。

例如,我有一个文本文件使用的是GBK编码,内容是”明月几时有“,

在这里插入图片描述

在这里插入图片描述

我使用VS code (微软的一款非常好用的文本编辑器)打开文件,用术语说,就是解码文件。其默认使用的文字编码是UTF-8,解码相同。但是,因为我的文本底层是GBK编码的01串(两个字节一个字符),使用UTF-8解码01串,由于编码,解码不一致,必然会导致乱码。这时,只要手动选择对应的GBK编码,解码文件就不会乱码了。

乱码也从侧面说明了,字符编码不是文件的固有属性

扯了这么多,就是为了说明这一点:字符编码就是解码和编码时用的规则,不是文件的固有属性。

我不禁产生疑惑,为什么当初不把字符编码设置为文件属性的一部分呢?

假设可以设置,并且设置为GBK,那么操作系统需要维护改功能。像一个文件是不可写的,那么有程序试图写文件,操作系统会拒绝写入一样,操作系统必须写入的字节必须是满足GBK编码要求,那么每次写入字节,操作系统都需要检查该字节的合法性,这需要非常大的性能开销,甚至是无法实现的,因为有些特殊字节即可以表示GBK,也可以表示UTF-8,是有歧义的。在说,做这一些的意义是什么,为了编辑器可以在打开文件的时候,可以根据编码属性选择正确的编码吗?没有必要,智能的编辑器,可以根据内容的前几个字节,推断出你的01串使用了什么编码。另外,你也可以手动设置解码所用的字符编码。

三 、问题解决

在创建文件的时候,无法指定文件的编码。在将文字写入(例如文本编辑器的Ctrl + S 保存,本质执行的就是写入操作)文件时,可以选择将文字转换为01串的编码规则。

针对Java程序,代码如下,正是文章最开始提及的代码:

FileInputStream fis=new FileInputStream(“xxxx.txt”);
OutputStreamWriter osw=new OutputStreamWriter(fis,“UTF-8”);

推荐学习:《java视频教程

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

834

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

739

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

735

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

399

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

446

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

430

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16926

2023.08.03

高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

42

2026.01.16

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Kotlin 教程
Kotlin 教程

共23课时 | 2.6万人学习

C# 教程
C# 教程

共94课时 | 6.9万人学习

Java 教程
Java 教程

共578课时 | 46.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号