텍스트 파일을 읽어 한글인지 영어인지 구분하기!

만약 텍스트 파일이

english는 매우 hard 해서 싫다.

(1)이런글이 있으면 총 단어는 몇개인지

(2)영어단어는 몇단어 이고 한글은 몇단어인지

알아내는걸 만들고 싶은데요.. 마땅히 아이디어가 없네요..

(3) 그리고 만약에 텍스트 파일 마지막에

내용은 없는데 엔터만 쳐지거나 스페이스만 쳐져 있는 경우 있잖아요.

카운터 증가가 안되게 파일 마지막부분은 제외시키는 방법이 있을까요?

마땅한 알고리즘이나 아이디어가 인터넷에도 없어서..

부탁드립니다!!

제 생각은 fsanf로 읽어서 공백을 읽어 총 단어수를 구하고.

fgetc() 를 이용해서 한글자 씩 읽어 옵니다. 그리고 한글자 씩 마다 0x80을 & 시켜서 상위비트가 1이면 한글이니

한글이 나오면 다음 한 바이트까지 읽어서 처음읽은 단어와 다음바이트까지 읽은 것은 합쳐서 그 단어가 한글인지 판별하는건데..

여러모로 알고리즘이 애석하네요.. 중 고수분들 많은 도움 부탁드립니다!!