java如何获取一个文件的编码方式呢?
下文笔者讲述java代码获取文件编码方式的方法分享,如下所示
获取文件编码方式的实现思路
获取文件的编码,我们可以使用以下方法:
借助第三方库:
Apache Tika、juniversalchardet、ICU
可自动对文件进行编码方式检测
例:
使用 Apache Tika 获取文件编码
Apache Tika
是一个用Java实现的开源文档检测和内容提取框架
它支持自动检测多种文件编码
Maven项目中
添加以下依赖
org.apache.tika
tika-core
1.22
import org.apache.tika.detect.EncodingDetector;
import org.apache.tika.detect.TxtDetector;
import org.apache.tika.io.TikaInputStream;
import java.io.File;
import java.io.InputStream;
import java.nio.charset.Charset;
public class FileEncodingUtil {
public static void main(String[] args) throws Exception {
File file = new File("java265.txt");
// 构建一个txt类型的编码探测器
EncodingDetector encodingDetector = new TxtDetector();
// 获取文件流,方便Tika工具进行编码检测
InputStream inputStream = TikaInputStream.get(file);
Charset charset = encodingDetector.detect(inputStream, null);
System.out.println("文件编码:" + charset.name());
}
}
//上述代码
// 使用TxtDetector方式进行编码探测
// 输出结果charset.name()指文件编码
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。


