分享

读取文件查找中文字符

 樱花梦_张艺馨 2017-08-03

package com.zx.cn.test;

import java.io.BufferedReader;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStreamReader;

public class FindCN {

 public static void main(String[] args) throws IOException {
  File file= new File("d:\\new2.txt");
  FileInputStream fistwice = new FileInputStream(file);
  InputStreamReader isr = new InputStreamReader(fistwice,"gbk");//可以读中文内容,其中"gbk"也可能是“UTF-8”,根据自己写的文件字符集而定
   BufferedReader br = new BufferedReader(isr);  //用br操作读文件
   String str=null;
   int hang =1;
   while ((str= br.readLine())!=null) {//读了一行
   String str2 = br.readLine().trim();//取出的内容转到String中
   if(str2.getBytes().length != str2.length()) //这句就是来判断 String是否含有中文字符。
   {
    System.out.println(str2);
    for(int i=0;i<str2.length();i++){
    
     char[] c = str2.toCharArray();
     if(c[i]>= 0x4e00 && c[i]<=0x9fbb){
      System.out.println("第"+hang +"第"+i+"字符,’"+c[i]+"‘是中文字符");
     }
    }
   }else{
    System.out.println(hang+"行,不存在中文字符");
   }
   hang++;
  }
 }
}
==============================
结果:
1行,不存在中文字符
2行,不存在中文字符
MBOLSADORA VERTICAL CONTINUA MULTIBOLSA CON INSERCI脫N DE BOQUILLA
第3第51字符,’脫‘是中文字符
4行,不存在中文字符
5行,不存在中文字符
6行,不存在中文字符
7行,不存在中文字符
8行,不存在中文字符
9行,不存在中文字符
10行,不存在中文字符
11行,不存在中文字符
12行,不存在中文字符
[CO]|||3.2|2017-08-01T08:04:21|ingreso|Pago en una sola exhibici贸
第13第64字符,’贸‘是中文字符
14行,不存在中文字符

    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多