본문 바로가기
반응형

전체 글78

ML Kit - 모바일 머신러닝 라이브러리 모바일에서 간단한 AI 모델을 구동할 경우 직접 모델을 만들고 모바일에 적용하는 과정을 겪지 않아도 ML Kit 라이브러리를 사용하면 빠르게 개발할 수 있습니다. ML Kit은 구글에서 개발한 안드로이드용 머신 러닝 SDK로, 모바일 애플리케이션에서 머신 러닝과 관련된 기능을 쉽게 개발할 수 있도록 지원해줍니다. 이를 통해 개발자들은 복잡한 머신 러닝 모델의 구축과 통합에 대한 고민 없이, 머신 러닝을 활용한 기능을 앱에 추가할 수 있습니다. 일반적으로 모바일 AI 개발을하려면 Tensorflow Lite나 Pytorch Mobile을 사용하겠지만, 특정 Task만 간단하게 구현할 경우 ML Kit을 유용하게 쓸 수 있습니다. ML Kit에서 제공되는 기능은 다음과 같습니다. 이미지 분석 이미지에서 특정.. 2023. 5. 25.
스픽 영어회화 앱 AI튜터 후기 스픽 이라는 어플에서 GPT-4를 적용해서 AI 회화 기능을 개발했다길래 한번 써봤다. 해외에 나갈일이 전혀 없다가 올해 초에 대만과 일본에 갔는데 영어의 필요성을 느꼈고, AI 튜터 기능도 써보고 싶어서 스픽이라는 앱을 설치하고 1년 결제를 했다. 이제 한달 조금 넘게 사용했다. 스픽은 다른 영어 공부 앱이랑 다르게 회화 위주로 진행이 된다. 개인적으로 회화학원 다니는것보다 나은점은 언제 어디서든 앱을 켜고 공부를 할 수 있는 점인 것 같다. 일단 음성인식률 생각보다 괜찮은것같다. 방에서 혼자 AI튜터랑 얘기하는 경우에는 인식률이 체감상 95~97%? 정도 되는것같다. 잘된다. 근데 차에서 운전하거나 noise가 있는 경우에는 인식률이 좀 떨어진다. 얘기를하면 전혀 다른 말로 인식할때가 가끔 있다. 그.. 2023. 5. 23.
Vision Transformer 최근에 이미지 인식의 다양한 분야에 Transformer[1]가 적용되어 높은 성능을 달성하고 있다. 예전에는 Convolutional Layer를 겹겹이 쌓는 방식으로 이미지의 특징을 추출하고 이를 통해 이미지를 인식하는 방법이 대세였지만 Vision Transformer[2] 이후 이미지 인식 패러다임이 많이 바뀌고 있다는 것이 느껴진다. Transformer는 주로 자연어 처리 분야에 적용되어 높은 성능을 이끌어왔다. 최근 몇 년간 자연어 처리의 많은 Task에서 SOTA를 이룬 BERT, GPT 언어모델은 각각 Transformer의 Encoder와 Decoder를 기반한 모델이다. Transformer의 특징은 RNN, CNN과는 다르게 Attention만을 활용해 모델을 구축한 것이다. 그림 .. 2023. 5. 23.
Text Detection : Arbitrary Shape Text Detection via Boundary Transformer (TextBPN++) 논문 리뷰 Scene Text Detection을 수행하는 Arbitrary Shape Text Detection via Boundary Transformer [1](TextBPN++)에 대한 논문 리뷰이다. 이 모델은 그림 1과 같이 Arbitrary shape 글자에 대해서도 비교적 잘잡는 모습을 보여준다.회전되거나 휘어진 글자 영역을 정확히 잡는 일은 쉽지 않은 작업이다. 특히 정확한 글자 영역을 잡기 위해서 복잡한 Post-Processing 방법이 적용되는 경우가 많은데 이 논문은 그런 post-processing 과정 없이 글자의 boundary를 학습해서 잡는 방법을 제안한다. 논문의 핵심 키포인트는 coarse-to-fine 방식으로 반복적으로 boundary를 잡는 transformer를 적용해서 .. 2023. 5. 23.
python 한글 파일명 이미지 저장하기 한글 파일명 이미지 다루기 이미지를 저장할 때 opencv를 사용해서 cv2.imwrite 함수를 사용할 경우 파일명을 한글로 하면 한글이 깨져서 저장됩니다. 그런 경우 imwrite함수를 쓰지 않고 아래 코드와 같이 저장하면 한글 파일명으로 저장할 수 있습니다. try: ext = ".jpg" result, n = cv2.imencode(ext, img, None) if result: with open("./dir_path/파일명.jpg", mode='w+b') as f: n.tofile(f) except Exception as e: print(e) 이미지를 불러올 때도 경로에 한글이 있으면 imread() 함수가 정상적으로 동작하지 않습니다. 그런 경우 imread() 함수를 사용하지 않고 다음과 같.. 2023. 5. 19.
python 이미지 데이터 합성 : 알파블렌딩 (겹쳐보이기) 이미지를 합성할때 배경이미지에 전경이미지를 완전히 합성하는게 아니라 투명하도록 배경이미지와 전경이미지가 둘다 사라지지않고 보여야하는 경우가 있습니다. 그럴경우 다음과 같이 코드를 수행합니다. from PIL import Image background = Image.open("./background/bg.png") overlay = Image.open("./foreground/fg.png") overlay = overlay.resize((1280, 720)) background = background.convert("RGBA") overlay = overlay.convert("RGBA") new_img = Image.blend(background, overlay, 0.2) new_img.save("new... 2023. 5. 16.
반응형