본문 바로가기

Programming!

통신 상품정보나 일반 상품정보를 분석하다가..

임베딩 모델의 중요도가 갈 수록 높아지는게 느껴지고 있다.

 

뭐 우선은 허깅페이스의 모델을 이용해 임베딩하고 답변 모델로는 제미나이를 사용중이기는 한데.. 

 

정확도를 유지하려면 나름 많은 트릭을 추가해야 하는 상황이다.

 

음.. 어서 구글에서 버텍스 모델 같은거 말고 정식 gemini api 로 다국어 지원 모델을 내주면 좋겠다는 생각이다.

(물론 text-embedding-large-exp 가 있기는 한데.. 겁내 빨리 소진되어서..ㅜㅜ)

 

https://huggingface.co/blog/getting-started-with-embeddings

 

Getting Started With Embeddings

I adjusted my query function with the help of claude.ai like below and I can see output with a free tier def query(sentence_pairs): response = requests.post( api_url, headers=headers, json={"inputs": {"source_sentence": sentence_pairs[0], "sentences": sent

huggingface.co