안녕하세요.
개발 목표는 전화 통화상의 대화 내용을 텍스트화 시키는 어플 입니다.
일단 기본 음성인식은 SpeechRecognizer 를 사용하여 구현했습니다.
SpeechRecognizer 는 기본적으로 통화의 마이크와 스피커 어느 방향의 인풋에도 대응을 하는데요,
그래서 둘 모두 동시에 대응하기에 수신자와 발신자의 구분이 불가능합니다.
수신자 : 안녕하세요.
발신자 : 응, 안녕.
아웃풋 : 안녕하세요. 응, 안녕.
예를 들자면 위와 같이 반응합니다.
이를 분리하는 방법이 있을까요 ?
만약 SpeechRecognizer 로 불가능 하다면 다른 좋은 방법이 있을까요 ?
감사합니다.
즐거운 하루되세요.