Java如何获取文件类型呢?
下文笔者讲述java中获取文件类型的方法分享,如下所示
方式1:
根据文件后缀名
1.Files.probeContentType
2.URLConnection.guessContentTypeFromName
3.URLConnection.getFileNameMap
4.MimetypesFileTypeMap
方式2:
根据文件流的前几个字符判断文件类型
1.URLConnection.getContentType
2.URLConnection.guessContentTypeFromStream
3.jmimemagic
4.tika
根据文件扩展名判断
优点:
速度快,代码简单
缺点:
无法判断出真实的文件类型
例
一些伪造的文件或者没有后缀名称的文件
根据文件流中前几个字符判断
优点: 可以判断出真实的文件类型 缺点: 速度慢,代码复杂例:
使用Files.probeContentType
Java1.7开始,提供了用于解决MIME类型的方法 Files.probeContentType:
public static void test() throws IOException {
Path path = new File("d:/test.png").toPath();
String mimeType = Files.probeContentType(path);
System.out.println(mimeType);
}
使用URLConnection
URLConnection提供了几种用于检测文件的MIME类型的API。
使用getContentType
public void test(){
File file = new File("d:/test.png");
URLConnection connection = file.toURL().openConnection();
String mimeType = connection.getContentType();
}
使用guessContentTypeFromName
public void test(){
File file = new File("d:/test.png");
String mimeType = URLConnection.guessContentTypeFromName(file.getName());
}
使用guessContentTypeFromStream
public static void test() throws Exception {
FileInputStream inputFile = new FileInputStream("d:/test.doc");
String mimeType = URLConnection.guessContentTypeFromStream(new BufferedInputStream(inputFile));
System.out.println(mimeType);
}
使用getFileNameMap
使用URLConnection获得MIME类型的更快方法是使用getFileNameMap()方法:
public void test(){
File file = new File("d:/test.png");
FileNameMap fileNameMap = URLConnection.getFileNameMap();
String mimeType = fileNameMap.getContentTypeFor(file.getName());
}
使用MimeTypesFileTypeMap
public void test() {
File file = new File("product.png");
MimetypesFileTypeMap fileTypeMap = new MimetypesFileTypeMap();
String mimeType = fileTypeMap.getContentType(file.getName());
}
使用jmimemagic
jMimeMagic是一个受限制许可的库,我们可以使用它来获取文件的MIME类型。
配置Maven依赖:
<dependency>
<groupId>net.sf.jmimemagic</groupId>
<artifactId>jmimemagic</artifactId>
<version>0.1.5</version>
</dependency>
public void test() {
File file = new File("d:/test.doc");
MagicMatch match = Magic.getMagicMatch(file, false);
System.out.println(match.getMimeType());
}
使用Apache Tika
Apache Tika是一个工具集,可检测并从各种文件中提取元数据和文本。它具有丰富而强大的API,并带有[tika-core],我们可以利用它来检测文件的MIME类型。
配置Maven依赖:
<dependency>
<groupId>org.apache.tika</groupId>
<artifactId>tika-core</artifactId>
<version>1.18</version>
</dependency>
接下来,我们将使用detect()方法来解析类型:
public void whenUsingTika_thenSuccess() {
File file = new File("d:/test.doc");
Tika tika = new Tika();
String mimeType = tika.detect(file);
}
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。


