lunara-kim's picture
Add new SentenceTransformer model
25ef0b5 verified
metadata
tags:
  - sentence-transformers
  - sentence-similarity
  - feature-extraction
  - generated_from_trainer
  - dataset_size:4400
  - loss:MultipleNegativesRankingLoss
base_model: google-bert/bert-base-multilingual-cased
widget:
  - source_sentence: '고객: SEAT 애드온?'
    sentences:
      - '상담사: SEAT 애드온은 좌석 예약 옵션입니다. 위치별 가격 다릅니다.'
      - '상담사: CHD는 어린이 요금입니다. 만 2세~12세 기준 적용됩니다.'
      - '상담사: 네, PNR(예약기록) 조회되었습니다. 탑승자 성함, 일정 확인 가능하세요.'
  - source_sentence: '고객: 티켓 리이슈 가능?'
    sentences:
      - '상담사: NCF는 National Carrier Fee로 국가별 추가요금입니다. 요금표 참고해 주세요.'
      - '상담사: 네, 고객님. 리이슈—즉 항공권 재발행 도와드릴 수 있습니다. 날짜나 시간이 변경되시면 도와드릴게요.'
      - '상담사: ETD는 출발 예정 시간입니다. 오전 10시 30분 출발 예정입니다.'
  - source_sentence: >-
      안녕하세요. ▲/▲~▲/▲캠핀스키 그랜드 디럭스룸 4박 예약 관련해서 질문이 있어요. 제가 받은 답변에 따르면 총 금액이
      $1,508에서 15% 할인 적용하면 $1,281.8이 되는 건가요? 그리고 ▲월 초에도 적용된다고 하셨죠?
    sentences:
      - >-
        고객: 안녕하세요, 발리 호텔 견적 문의 드립니다. 성인 2명과 아이 2명(9세, 11세)입니다. ▲월 ▲일부터 ▲월 ▲일까지
        안다즈 발리 트윈 디럭스룸(조식 포함)과 ▲월 ▲일부터 ▲월 ▲▲일까지 W 발리 가든 이스케이프 트윈(조식 포함)으로 예약하고
        싶어요. W 호텔의 가격이 너무 높게 나와서 따로 문의 드립니다. 두 호텔의 견적 부탁드립니다.

        상담사: 안녕하세요! 문의 주셔서 감사합니다. 안다즈 호텔은 6 이상 아동 2명이 입실할 경우 시그니처룸이나 안다즈 스위트룸만
        이용 가능해요. ▲월 ▲일부터 ▲월 ▲일까지는 1박은  시즌, 나머지 3박은 레귤러 시즌으로 계산됩니다. 안다즈 4
        시그니처룸은  $1,310이고, 아동 2 조식  엑스트라 베드 1 추가하면 $300이 더해져서  $1,610이에요. 조식
        포함, 아동 엑스트라 베드 1 포함, 중식 2 제공, 미니바 무알콜 음료 무료, 안다즈 라운지 무료 이용 혜택이 있어요.

        고객: 감사합니다. W 발리 가든 이스케이프는 어떻게 되나요?

        상담사: W 발리는 ▲월 ▲일까지  시즌이어서 1박은  시즌, 나머지 2박은 레귤러 시즌으로 계산해요. 3 가든 
        이스케이프 객실은  $1,688이고, 아동 2 조식  엑스트라 베드 1 추가하면 $216이 더해져서  $1,904이에요.
        조식 포함, 아동 엑스트라 베드 1 포함되어 있어요. 3 이상 예약 시에는 ▲▲▲▲에서 무료 공항 픽업 1 제공됩니다.

        고객: 고맙습니다.

        상담사: 예약 진행 원하시면 전원 영문  한글 성함, 생년월일, 대표자 핸드폰 번호(발리 도착 후에도 연결 가능한 카톡
        아이디), 도착 항공편명을 이메일로 보내주시면 됩니다.  체크는 예약  가능 여부를 확인한  진행할게요.

        고객: 알겠습니다. 이메일로 보내드리도록 하겠습니다. 감사합니다!

        상담사: 네, 감사합니다! 이메일 기다릴게요. 궁금한  있으면 언제든지 문의해 주세요. 좋은 하루 되세요!
      - >-
        고객: 안녕하세요. ▲/▲~▲/▲캠핀스키 그랜드 디럭스룸 4박 예약 관련해서 질문이 있어요. 제가 받은 답변에 따르면 총 금액이
        $1,508에서 15% 할인 적용하면 $1,281.8이 되는 건가요? 그리고 ▲월 초에도 적용된다고 하셨죠?

        상담사: 안녕하세요! 네, 맞아요. $1,508에서 15% 할인 적용하면 $1,281.8이 됩니다. ▲월 초에도 할인 적용이
        됩니다.

        고객: 아동 엑스트라 베드는 디럭스룸의 경우 $38 아닌가요? 호텔 가격 안내표에는 그렇게 적혀있던데요.

        상담사: 맞습니다. 아동 엑스트라 베드는 디럭스룸의 경우 $38입니다. 그래서 아동 2명의 경우 (38+20)×4로 계산하시면
        됩니다.

        고객: 아동 1 엑스트라 베드 추가하고 아동 2 조식 추가하면 아동 2 모두 조식은 포함되는 거죠?

        상담사: 네, 아동 2 모두 조식이 포함됩니다. 엑스트라 베드는 필수로 추가하셔야 해요.

        고객: 그랜드 디럭스룸은 아동 엑스트라 베드가 필수인가요? 그리고 엑스트라 베드는 호텔에서 추가해도 가격은 동일한가요?

        상담사: 네, 그랜드 디럭스룸은 아동 엑스트라 베드가 필수입니다. 현장에서 추가하셔도 가격은 동일하게 유지됩니다.

        고객: 마지막으로 킹베드와 트윈베드  어느 쪽이  넓게   있을까요? 침대 너비를 알면 좋겠지만 조언만 주셔도 괜찮아요.

        상담사: 킹베드가 일반적으로  넓게   있어요. 침대 너비에 대한 정보는 저희도 따로 확인이 어려운  양해 부탁드립니다.

        고객: 신설 리조트라서 침대 후기가 많이 없어서 질문드렸어요. 답변 감사합니다!

        상담사: 도움이 되셨다니 기쁩니다! 추가 질문이 있으면 언제든지 문의해 주세요. 감사합니다!
      - >-
        고객: 안녕하세요. 예약 문의하려고 합니다. ▲월 ▲▲일에서 ▲▲일 사이에 성인 2명과 아이 2명(만 9세, 7세)으로 카자네무아
        엑스트라베드 추가한 뜰라가맨션과 토야빌라, 베지빌라 가격이 궁금해요. 그리고 ▲월 ▲▲일에서 ▲▲일 사이에 마라리버 엑스트라베드
        추가한 트위가룸 가격도 알고 싶어요.

        상담사: 안녕하세요! ▲월 ▲▲일부터 ▲▲일 사이에 카자네무아의 경우, 뜰라가맨션은 2박에 $312이고, 1베드 토야빌라는
        $476, 1베드 베지빌라는 $496이에요. ▲월 ▲▲일부터 ▲▲일 사이에 마라리버사파리의 트위가디럭스룸은 1박에 $360입니다.

        고객: 가격에 포함된 내용도 알려주실  있나요?

        상담사: 네, 조식과 세금이 포함되어 있어요. 객실 체크는 예약 요청  실시간으로 확인됩니다.

        고객: 결제를 승인받는  얼마나 걸리나요?

        상담사: 카드 결제도 가능해요. 국민, 현대, 삼성, 신한카드로 결제할  있고, 카드 결제  2.5% 수수료가 추가됩니다.
        현대카드는 무이자 3개월, 삼성은 5개월까지 무이자 혜택이 있어요.

        고객: 취소  부과되는 비용이 있나요?

        상담사: 비수기 시즌이라 체크인 날짜 기준으로 15 이전에 취소하면 호텔 패널티 없이 취소 가능해요. 하지만.. 여행사 수수료
        30,000원이 공제됩니다. 15 이내 취소  호텔 규정에 따라 패널티가 부과될  있어요.

        고객: 공항 픽업 서비스 이용 요금은 어떻게 되나요?

        상담사: 3 이상 예약  무료 공항 픽업 서비스가 제공돼요. 픽업 정보는 예약 시에 알려주시면 됩니다. 같은 항공편을 이용하는
        다른 손님과 조인될  있어요.

        고객: 예약을 진행하고 싶은데, 어떤 데이터를 보내야 하나요?

        상담사: 예약 원하시면 예약자 전원의 여권 영문 이름과 생년월일  6자리, 픽업 정보를 이메일로 보내주시면 됩니다.

        고객: 감사합니다.  부탁해요!

        상담사: 감사합니다! 궁금한  있으면 언제든지 연락 주세요. 즐거운 여행 되시길 바랍니다!
  - source_sentence: >-
      안녕하세요. ▲▲월 ▲▲일 오전 출발 엘리시안 예약금만 보내드리고 계약서는 아직까지 안보내고 있는 간큰 신부 ▲▲▲입니다. 요새
      인도네시아에 지진난 것 때문에 여기저기 난리더라구요. 저희는 뭐 다행히 부모님께서 발리가 인도네시아에 있다는 걸 모르시는지라 잘
      버티고 있답니다. 결혼 관련 커뮤니티들을 뒤지다 보니 발리 취소하시는 분들이 꽤 눈에 띄더라구요. 그래서 문득 든 생각! 앨리시안도
      좋긴 하지만... 제가 원래 첨부터 맘에 두고 있었던 곳이 까유마니스거든요. 혹시라도 까유마니스를 취소하시는 분들이 생기진
      않았을까...! 만약에 자리가 난다면 엘리시안 대신 까유마니스로 바꿀 순 없을까....! 전화를 드릴까 하다가... 회사라서 눈치도
      좀 보이고 제가 좀 소심한지라 정작 ▲▲▲ 대리님 목소리 들으면 풀빌라 바꾸고 싶다고 말을 못 꺼낼 거 같아서.... 제발 어디든
      가게만 해달라던 이전의 제 모습이 떠올라 부끄럽지만 이왕이면 첨에 찍어둔 곳으로 가고 싶으니 제 맘도 조금만 이해해주세요.. 이런 건
      비밀글로 올렸으면 싶은데.... 여긴 그런 기능이 없군요. 아 민망민망...
    sentences:
      - >-
        고객: 안녕하세요. ▲▲월 둘째주에 10박 12일 예정입니다. 두 명이구요. 가루다로 가고싶은데요. 대략 항공권 가격이
        궁금합니다. 언제쯤 예약하면 되는지 가격이 나오는지 알려주세요. 택스는 변동이 없나요??

        상담사: 안녕하세요! 발리 여행을 계획하고 계시군요. ▲▲월 둘째주 정확한 날짜를 알려주시면  정확한 정보를 드릴  있을 
        같아요.

        고객: 아, 날짜는 ▲▲월 ▲▲일부터 ▲▲월 ▲▲일까지입니다.

        상담사: 감사합니다! ▲▲월 ▲▲일 출발이면 성수기 요금이 적용될 가능성이 높아요. 비수기 기준으로 말씀드리면, 왕복 항공권은
        대략 680,000원 정도 예상하고 있어요.

        고객: 그럼 예약은 언제쯤 하는게 좋아요?

        상담사: 예약은 가능한 빨리 하시는  좋아요. 발리행 수요가 많아서 좌석이 빨리 차는 편이에요. 최소   전에는 예약하시는
         추천해 드립니다.

        고객: 택스는 변동이 없다고 하셨는데, 그건 확실한가요?

        상담사: 택스는 일반적으로 변동이 없지만, 환율에 따라 조금 달라질  있어요. 그래서 예약 시점에 확인하는  좋습니다.

        고객: 알겠습니다. 그럼 예약할  다시 문의드려도 될까요?

        상담사: 물론이죠! 언제든지 문의해 주세요. 도움이 필요하시면 언제든지 말씀해 주세요. 감사합니다!

        고객: 네, 감사합니다. 하루  보내세요!

        상담사: 감사합니다! 고객님, 좋은 하루 되세요!
      - >-
        고객: 안녕하세요. ▲▲월 ▲▲일 오전 출발 엘리시안 예약금만 보내드리고 계약서는 아직까지 안보내고 있는 간큰 신부 ▲▲▲입니다.
        요새 인도네시아에 지진난 것 때문에 여기저기 난리더라구요. 저희는 뭐 다행히 부모님께서 발리가 인도네시아에 있다는 걸 모르시는지라
        잘 버티고 있답니다. 결혼 관련 커뮤니티들을 뒤지다 보니 발리 취소하시는 분들이 꽤 눈에 띄더라구요. 그래서 문득 든 생각!
        앨리시안도 좋긴 하지만... 제가 원래 첨부터 맘에 두고 있었던 곳이 까유마니스거든요. 혹시라도 까유마니스를 취소하시는 분들이
        생기진 않았을까...! 만약에 자리가 난다면 엘리시안 대신 까유마니스로 바꿀 순 없을까....! 전화를 드릴까 하다가...
        회사라서 눈치도 좀 보이고 제가 좀 소심한지라 정작 ▲▲▲ 대리님 목소리 들으면 풀빌라 바꾸고 싶다고 말을 못 꺼낼 거
        같아서.... 제발 어디든 가게만 해달라던 이전의 제 모습이 떠올라 부끄럽지만 이왕이면 첨에 찍어둔 곳으로 가고 싶으니 제 맘도
        조금만 이해해주세요.. 이런 건 비밀글로 올렸으면 싶은데.... 여긴 그런 기능이 없군요. 아 민망민망...

        상담사: 안녕하세요, ▲▲▲ 신부님! 결혼 준비로 바쁘신  같네요. 다시 한번 축하드립니다. 까유마니스에 대한 간절한 마음이
        느껴져요. 현재 발리 현지에 요청을 해놓은 상태인데, 지진으로 인해 발리는 피해가 없어서 취소 건은 없답니다. 하지만 까유마니스
        스윗룸 체크는 부탁해둔 상황이에요. 내일 중으로 빠른 회신 드릴게요.

        고객: 아, 그렇군요. 그래도 까유마니스에 자리가 나면 좋겠어요. 엘리시안도 마감 상태라니, 정말 아쉽네요. 혹시 다른 대안은
        없을까요?

        상담사: 현재로서는 엘리시안도 인기라서 방을 구하기 힘든 상황이에요. 하지만 만약 까유마니스에 자리가 나면 바로 연락드릴게요.
        다른 대안은 지금은 없지만, 혹시라도 변동이 생기면 알려드릴게요.

        고객: 네, 감사합니다. 이렇게 신경 써주셔서 정말 고마워요. 결혼 준비가 이렇게 힘든  몰랐어요.

        상담사: 이해해요. 결혼 준비는 정말 많은 신경을 써야 하니까요. 언제든지 궁금한 점이나 요청사항 있으면 편하게 말씀해 주세요.
        최대한 도와드릴게요.

        고객: 네, 알겠어요. 혹시 까유마니스에 자리가 나면 바로 연락 주실  있죠?

        상담사: 네,  연락드릴게요. 신부님이 원하시는 곳으로 가실  있도록 최선을 다하겠습니다.

        고객: 정말 감사합니다. 기다릴게요. 좋은 하루 되세요!

        상담사: 신부님도 좋은 하루 되세요! 언제든지 연락 주세요.
      - >-
        고객: 안녕하세요, 결혼 20주년 여행을 계획 중인데요. 발리 여행에 대해 몇 가지 질문이 있어요.

        상담사: 안녕하세요! 여행 준비 중이시군요. 어떤 질문이든지 편하게 해주세요.

        고객: 한국에서 도시락 와이파이를 가져가는  좋을까요, 아니면 공항에서 유심칩을 사는  좋을까요?

        상담사: 요금과 데이터 용량을 비교해보시고 결정하시는  좋을  같아요. 개인적인 사용 패턴에 따라 다를  있으니까요.

        고객: 공항 픽업 서비스는 어떻게 되나요? 호텔에서 제공하는 서비스가 있다고 들었어요.

        상담사: 맞아요, 대부분의 리조트에서 유료로 공항 픽업 서비스를 제공해요. 미리 예약하시면 편리할 거예요.

        고객: 5 6 일정에 대해 고민 중인데, 쿠타해변에서 2박, 우붓에서 2박, 쿠타 시내에서 1박을 생각하고 있어요.
        괜찮을까요?

        상담사: 좋은 계획이에요! 쿠타와 우붓을 조화롭게 배치하셨네요. 쿠타 지역에서 1 10만원 이하의 호텔도 추천해드릴게요.

        고객: 어떤 호텔이 좋을까요?

        상담사: 쿠타 지역에서는 솔하우스 르기안 호텔, 더선셋 호텔, 하퍼꾸따 호텔이 괜찮아요. 우붓은 코마네카라사사양이나 알라야우붓을
        추천드려요.

        고객: 해보고 싶은 액티비티가 많은데, 우붓 투어와 래프팅 가격이 어떻게 되나요?

        상담사: 우붓 투어는 1인당 45달러, 소백 아융 래프팅은 1인당 65달러예요. 시내 관광은 렌트카를 이용하시면 자유롭게 다니실
         있어요.

        고객: 렌트카 예약은 어떻게 하나요? 가격도 궁금해요.

        상담사: APV(7인승) 렌트카는 10시간에 79달러예요. 가이드 동행은 별도이고, 예약  실시간으로 가능 여부를 확인할 
        있어요.

        고객: 마지막으로, 여행  유용한 팁이 있을까요?

        상담사: 현지에서의 환전은 실시간 환율을 체크하시고, 현금으로 결제하시면 좋습니다. 카드 결제  수수료가 붙으니 참고하세요.

        고객: 감사해요. 많은 도움이 되었어요

        상담사: 무슨 말씀을요! 즐거운 여행 되시길 바랍니다. 궁금한  있으면 언제든지 문의해 주세요.
  - source_sentence: >-
      안녕하세요. ▲▲월 ▲▲일부터 ▲▲일까지 더물리아 숙소 견적 부탁드립니다. 성인 2명과 4세 유아 1명입니다. 공항 픽업 대신 공항
      드랍도 가능한가요?
    sentences:
      - >-
        고객: 안녕하세요. ▲▲월 ▲▲일 발리 예약한 고객입니다. 전화로만 진행하다가 이렇게 글 남겨봅니다. 최종 결제까지 완료했는데,
        진행 상황이 궁금합니다. 요즘 인도네시아에 여러 가지 문제가 있어서 걱정이 많습니다. 부모님도 여행을 반대하고 계신데, 정확한
        정보가 필요합니다.

        상담사: 안녕하세요, ▲▲▲ 고객님! 이렇게 글로 소통하게 되어 반갑습니다. 우선 항공과 호텔 모두 입금이 완료된 상태입니다.
        바우처는 호텔에서 받는 대로 스캔해서 이메일로 보내드릴게요.

        고객: 그럼 항공권은 언제 발권되나요? 결제 정보는 어떻게 확인하죠?

        상담사: 항공권은 발권되면서 카드 결제가 승인될 거예요. 결제 정보는 문자로 전송될 예정입니다. 발권이 완료되면 이메일로도
        안내드릴게요.

        고객: 아, 그러면 제가  일은 없겠네요?

        상담사: 맞아요! 고객님께서 해주실 일은 모두 완료하셨으니, 이제 저희가 처리할 일만 남았어요. 마음 편히 기다리시면 됩니다.

        고객: 최근 인도네시아 상황이 걱정되는데, 발리와는 거리가 먼가요?

        상담사: 네, 발리와 수마트라 지역은  1200킬로미터 정도 떨어져 있어요. 한국에서 태국 가는 거리와 비슷하답니다.  정확한
        정보는 공지사항으로 올리고 있으니 확인해 주시면 좋을  같아요.

        고객: 감사합니다. 그럼 즐거운 추석 보내세요!

        상담사: 감사합니다, ▲▲▲ 고객님! 즐거운 추석 되세요. 필요하신 사항 있으면 언제든지 연락 주세요!
      - >-
        고객: 안녕하세요. ▲▲월 ▲▲일부터 ▲▲일까지 더물리아 숙소 견적 부탁드립니다. 성인 2명과 4세 유아 1명입니다. 공항 픽업
        대신 공항 드랍도 가능한가요?

        상담사: 안녕하세요, ▲▲▲ 님. 문의 주셔서 감사합니다. ▲▲월 ▲▲일부터 ▲▲일까지 4박에 대한 견적 안내 드릴게요.

        고객: 어떤 객실이 가능한가요?

        상담사: 현재 더물리아에서 가능한 객실은  가지입니다.   스위트 가든뷰는 4박에 1,443불이고,   스위트
        비치프론트뷰는 1,710불이에요.  객실 모두 4 자녀는 무료로 부모님과 베드쉐어 가능합니다.

        고객:  바론 스위트는 예약이  되는 건가요?

        상담사: 네, 맞아요.  바론 스위트는 현재 예약이 종료된 상태입니다. 그래서   스위트만 예약 가능해요.

        고객: 객실의 크기나 구조는 어떻게 되나요?

        상담사:  바론 스위트는 면적이 105m²이고, 넓은 스위트룸 구조예요. 반면,   스위트는 130m²로 침실과 리빙 공간이
        분리된 구조입니다.

        고객: 예약할  다시 확인해 주시는 건가요?

        상담사: 네, 맞습니다. 예약 시점에 객실 가능 여부를 다시 체크해서 가능한 경우에만 예약 진행할  있어요.

        고객: 공항 드랍은 어떻게 진행되나요?

        상담사: 공항 픽업 대신 공항 드랍으로 변경 가능하니, 예약 시에 말씀해 주시면 됩니다.

        고객: 감사합니다. 

        상담사: 감사합니다, ▲▲▲ 님. 추가 문의사항 있으면 언제든지 말씀해 주세요. 좋은 하루 되세요!
      - >-
        고객: 안녕하세요. 인도네시아 할인항공권 문의 드립니다. ▲▲일에서 한 달 일정으로 가고 싶은데, 가루다항공으로 예약 가능한가요?
        성인 5명인데, 4명은 한 달 티켓, 1명은 2달 티켓으로요.

        상담사: 안녕하세요. 문의 주셔서 감사합니다. 인천-발리-자카르타-인천 항공권 예약 가능합니다. 다만, 자카르타-인천 구간은
        대한항공만 운항하니 참고해 주세요.

        고객: 그럼 자카르타-인천 구간은 대한항공으로 예약해야 하나요? 가격은 어떻게 되나요?

        상담사: 맞습니다. 자카르타-인천은 대한항공으로 발권하셔야 해요.   티켓 기준으로  74 원이고,   티켓은 유효하지
        않아요.   티켓은  88  정도입니다. 세금은 별도입니다.

        고객: 인천-자카르타-발리-인천 일정이  나은가요?

        상담사: 인천-발리-자카르타-인천 일정도 괜찮습니다. 항공료는 비슷하지만, 국내선 구간 포함하면  저렴할  있어요. 좌석
        상태도 체크해 보시는  좋습니다.

        고객: 그럼 발리에서 자카르타까지는 어떤 항공편이 있나요?

        상담사: 발리에서 자카르타까지는 여러 시간대의 항공편이 있어요. 가루다항공을 이용하시면 됩니다. 정확한 시간대는 확인해 보셔야
        해요.

        고객: 좌석 상황은 어떻게 확인하나요?

        상담사: 좌석 상황은 저희에게 전화 주시면 자세히 안내해 드릴  있어요. 전화번호는 ▲▲-▲▲▲-▲▲▲▲입니다.

        고객: 고맙습니다. 알겠습니다!

        상담사: 감사합니다! 좋은 하루 되시길 기원합니다!
pipeline_tag: sentence-similarity
library_name: sentence-transformers

SentenceTransformer based on google-bert/bert-base-multilingual-cased

This is a sentence-transformers model finetuned from google-bert/bert-base-multilingual-cased. It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.

Model Details

Model Description

  • Model Type: Sentence Transformer
  • Base model: google-bert/bert-base-multilingual-cased
  • Maximum Sequence Length: 512 tokens
  • Output Dimensionality: 768 dimensions
  • Similarity Function: Cosine Similarity

Model Sources

Full Model Architecture

SentenceTransformer(
  (0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: BertModel 
  (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
)

Usage

Direct Usage (Sentence Transformers)

First install the Sentence Transformers library:

pip install -U sentence-transformers

Then you can load this model and run inference.

from sentence_transformers import SentenceTransformer

# Download from the 🤗 Hub
model = SentenceTransformer("lunara-kim/custom-embedding-slang-model")
# Run inference
sentences = [
    '안녕하세요. ▲▲월 ▲▲일부터 ▲▲일까지 더물리아 숙소 견적 부탁드립니다. 성인 2명과 4세 유아 1명입니다. 공항 픽업 대신 공항 드랍도 가능한가요?',
    '고객: 안녕하세요. ▲▲월 ▲▲일부터 ▲▲일까지 더물리아 숙소 견적 부탁드립니다. 성인 2명과 4세 유아 1명입니다. 공항 픽업 대신 공항 드랍도 가능한가요?\n상담사: 안녕하세요, ▲▲▲ 님. 문의 주셔서 감사합니다. ▲▲월 ▲▲일부터 ▲▲일까지 4박에 대한 견적 안내 드릴게요.\n고객: 어떤 객실이 가능한가요?\n상담사: 현재 더물리아에서 가능한 객실은 두 가지입니다. 더 얼 스위트 가든뷰는 4박에 1,443불이고, 더 얼 스위트 비치프론트뷰는 1,710불이에요. 두 객실 모두 4세 자녀는 무료로 부모님과 베드쉐어 가능합니다.\n고객: 더 바론 스위트는 예약이 안 되는 건가요?\n상담사: 네, 맞아요. 더 바론 스위트는 현재 예약이 종료된 상태입니다. 그래서 더 얼 스위트만 예약 가능해요.\n고객: 객실의 크기나 구조는 어떻게 되나요?\n상담사: 더 바론 스위트는 면적이 105m²이고, 넓은 스위트룸 구조예요. 반면, 더 얼 스위트는 130m²로 침실과 리빙 공간이 분리된 구조입니다.\n고객: 예약할 때 다시 확인해 주시는 건가요?\n상담사: 네, 맞습니다. 예약 시점에 객실 가능 여부를 다시 체크해서 가능한 경우에만 예약 진행할 수 있어요.\n고객: 공항 드랍은 어떻게 진행되나요?\n상담사: 공항 픽업 대신 공항 드랍으로 변경 가능하니, 예약 시에 말씀해 주시면 됩니다.\n고객: 감사합니다. \n상담사: 감사합니다, ▲▲▲ 님. 추가 문의사항 있으면 언제든지 말씀해 주세요. 좋은 하루 되세요!',
    '고객: 안녕하세요. 인도네시아 할인항공권 문의 드립니다. ▲▲일에서 한 달 일정으로 가고 싶은데, 가루다항공으로 예약 가능한가요? 성인 5명인데, 4명은 한 달 티켓, 1명은 2달 티켓으로요.\n상담사: 안녕하세요. 문의 주셔서 감사합니다. 인천-발리-자카르타-인천 항공권 예약 가능합니다. 다만, 자카르타-인천 구간은 대한항공만 운항하니 참고해 주세요.\n고객: 그럼 자카르타-인천 구간은 대한항공으로 예약해야 하나요? 가격은 어떻게 되나요?\n상담사: 맞습니다. 자카르타-인천은 대한항공으로 발권하셔야 해요. 한 달 티켓 기준으로 약 74만 원이고, 두 달 티켓은 유효하지 않아요. 세 달 티켓은 약 88만 원 정도입니다. 세금은 별도입니다.\n고객: 인천-자카르타-발리-인천 일정이 더 나은가요?\n상담사: 인천-발리-자카르타-인천 일정도 괜찮습니다. 항공료는 비슷하지만, 국내선 구간 포함하면 더 저렴할 수 있어요. 좌석 상태도 체크해 보시는 게 좋습니다.\n고객: 그럼 발리에서 자카르타까지는 어떤 항공편이 있나요?\n상담사: 발리에서 자카르타까지는 여러 시간대의 항공편이 있어요. 가루다항공을 이용하시면 됩니다. 정확한 시간대는 확인해 보셔야 해요.\n고객: 좌석 상황은 어떻게 확인하나요?\n상담사: 좌석 상황은 저희에게 전화 주시면 자세히 안내해 드릴 수 있어요. 전화번호는 ▲▲-▲▲▲-▲▲▲▲입니다.\n고객: 고맙습니다. 알겠습니다!\n상담사: 감사합니다! 좋은 하루 되시길 기원합니다!',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 768]

# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]

Training Details

Training Datasets

Unnamed Dataset

  • Size: 4,200 training samples
  • Columns: sentence_0 and sentence_1
  • Approximate statistics based on the first 1000 samples:
    sentence_0 sentence_1
    type string string
    details
    • min: 9 tokens
    • mean: 86.81 tokens
    • max: 438 tokens
    • min: 24 tokens
    • mean: 475.98 tokens
    • max: 512 tokens
  • Samples:
    sentence_0 sentence_1
    안녕하세요? 여행 견적 문의 드립니다. 어른 4명 가족여행이고, 숙소는 2베드룸 또는 1베드룸 2개로 부탁드려요. 호텔과 골프 예약 여부도 확인해 주세요. 고객: 안녕하세요? 여행 견적 문의 드립니다. 어른 4명 가족여행이고, 숙소는 2베드룸 또는 1베드룸 2개로 부탁드려요. 호텔과 골프 예약 여부도 확인해 주세요.
    상담사: 안녕하세요~ 여행 일정 알려주셔서 감사합니다.
    고객: 네, 일정은 ▲월 ▲▲일부터 ▲▲월 ▲일까지입니다. 호텔은 발리 우붓의 카욘 정글리조트 또는 만다파 리츠칼튼, 그리고 켐핀스키와 아야나로 예약하고 싶어요.
    상담사: ▲/▲▲~▲/▲▲ 발리 우붓의 카욘 정글리조트는 전객실 예약이 마감되었어요. 만다파 리츠칼튼은 Reserve Suite 2객실로 2박에 $3404입니다.
    고객: 만다파 리츠칼튼으로 예약할게요. 그럼 켐핀스키와 아야나는 어떻게 되나요?
    상담사: 켐핀스키는 Sriwijaya Two-Bedroom Villa로 2박에 $2128입니다. 아야나는 전객실 예약이 마감되었어요.
    고객: 아야나는 예약이 안 되면 다른 호텔로 대체할 수 있나요?
    상담사: 네, 아야나 대신 다른 호텔로 추천드릴 수 있어요. 어떤 스타일의 호텔을 원하시나요?
    고객: 바다 근처의 리조트면 좋겠어요. 골프 예약도 확인해 주세요.
    상담사: 골프는 ▲/▲▲ 한다라CC 오전 9시, 1인당 $115입니다. ▲/▲▲ 내셔널CC는 8시 6분, 1인당 $165이고, ▲/▲▲ 뉴꾸따CC는 8시에 1인당 $100입니다.
    고객: 골프도 모두 예약해 주세요. 예약 진행하려면 어떻게 해야 하나요?
    상담사: 예약 진행 원하시면 전원 영문&한글 성함, 생년월일, 대표자 핸드폰 번호, 도착 항공편명(3박 이상일 경우)을 이메일로 보내주시면 됩니다.
    고객: 알겠습니다. 곧 필요한 정보 보내드릴게요. 감사합니다!
    상담사: 감사합니다!! 좋은 하루 되셔요.
    안녕하세요. ▲월 항공권은 이미 예약했는데, 위약금 없이 취소 가능한 시점이 ▲월이라고 하더라고요. 회사에서 코로나 사태가 종식될 때까지 동남아 여행 자제를 하라는 지침이 내려와서요. 그래서 ▲월 초에 호텔 예약을 해야 할 것 같은데, 혹시 ▲월 정도에 ▲월 중순 예약하면 늦나요? 아직 리조트는 확실하게 정해진 건 아닌데, 꾸따 쉐라톤 2박, 짐바란(아야나, 포시즌) 또는 누사두아(물리아) 4박 정도 하고 싶어요. 고객: 안녕하세요. ▲월 항공권은 이미 예약했는데, 위약금 없이 취소 가능한 시점이 ▲월이라고 하더라고요. 회사에서 코로나 사태가 종식될 때까지 동남아 여행 자제를 하라는 지침이 내려와서요. 그래서 ▲월 초에 호텔 예약을 해야 할 것 같은데, 혹시 ▲월 정도에 ▲월 중순 예약하면 늦나요? 아직 리조트는 확실하게 정해진 건 아닌데, 꾸따 쉐라톤 2박, 짐바란(아야나, 포시즌) 또는 누사두아(물리아) 4박 정도 하고 싶어요.
    상담사: 안녕하세요, ▲▲▲님! ▲▲▲▲ 여행사입니다. 올해는 ▲▲월부터 ▲월에 발리 사전예약이 많았어요. ▲월 말부터 코로나19 사태 이후 예약이 조금 줄어들긴 했지만, 여전히 많은 분들이 예약하고 계세요. 인기 있는 호텔은 벌써 ▲▲월 특정 날짜가 풀부킹된 경우도 있어요.
    고객: 그럼 ▲월 초에 예약하면 정말 늦을까요?
    상담사: ▲월 초에 ▲월 중순 출발을 예약하는 게 늦을 수도 있고, 아닐 수도 있어요. 발리에 호텔이 많아서 미리 예약하시는 분들이 80
    90% 정도고, 막판에 예약하시는 분들도 1020% 정도 있거든요.
    고객: 그럼 제가 원하는 호텔이 없으면 다른 호텔로 가야 할까요?
    상담사: 만약 정하신 호텔을 꼭 가야 한다면 미리 예약하시는 게 좋고, ▲
    ▲월에 취소하셔도 괜찮아요. 여름 성수기에는 일반적으로 한 달 전에 취소하면 캔슬피가 없어요.
    고객: 그렇군요. 그런데 여행사 취소 수수료는 어떻게 되나요?
    상담사: 저희 여행사에서는 취소 수수료가 3만 원이 있어요. 호텔별로 다르긴 하지만, 이 점도 참고해 주시면 좋겠어요.
    고객: 알겠습니다. 감사합니다. 좋은 주말 되세요!
    상담사: 네, ▲▲▲님도 행복한 주말 되세요! 언제든지 궁금한 점 있으면 문의해 주세요.
    안녕하세요. ▲▲월 ▲▲일부터 ▲▲일까지 예약하고 싶은데, 가능한지 궁금해요. 고객: 안녕하세요. ▲▲월 ▲▲일부터 ▲▲일까지 예약하고 싶은데, 가능한지 궁금해요.
    상담사: 안녕하세요! 예약하고 싶은 호텔에 대해 말씀해 주시면 확인해 드릴게요.
    고객: 노보텔 응우라이 에어포트 호텔은 가능한가요?
    상담사: 아쉽게도 노보텔 호텔은 저희 쪽에서 예약이 불가능해요. 다른 호텔들은 예약 가능하니 확인해 드릴게요.
    고객: 그럼 더블식스 스미냑과 우붓 파르마 리조트는 어떤가요?
    상담사: 네, 더블식스 스미냑 디럭스 스위트 오션뷰는 2박에 $485로 예약 가능하고, 우붓 파르마 리조트 프리미어룸은 2박에 $465로 예약할 수 있어요. 이 가격은 25% 할인 적용된 금액이에요.
    고객: 사마베 발리 허니문 패키지는요?
    상담사: 사마베 허니문 3박 패키지는 허니문 스위트룸이 $1,425, 원베드룸 풀빌라는 $1,795로 예약 가능해요. 올인클루시브 1일 제공되고, 데브단쇼도 1회 관람할 수 있어요.
    고객: 예약을 진행하려면 어떤 절차를 따라야 하나요?
    상담사: 예약 원하시면 두 분의 영문 및 한글 이름, 생년월일, 대표자 이메일 주소와 연락처를 이메일로 보내주시면 돼요.
    고객: 공항 픽업 예약 시 취소가 가능하다면 언제까지 가능한가요?
    상담사: 공항 픽업은 무료로 제공되며, 우붓 지역은 $15에 이용할 수 있어요. 항공편 정보도 함께 적어주시면 됩니다.
    고객: 고맙습니다. 잘 부탁드립니다!
    상담사: 감사합니다! 예약 진행 후에 필요한 정보 보내주시면 최선을 다해 도와드릴게요. 좋은 하루 되세요!
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Unnamed Dataset

  • Size: 200 training samples
  • Columns: sentence_0 and sentence_1
  • Approximate statistics based on the first 200 samples:
    sentence_0 sentence_1
    type string string
    details
    • min: 9 tokens
    • mean: 11.15 tokens
    • max: 14 tokens
    • min: 24 tokens
    • mean: 32.0 tokens
    • max: 48 tokens
  • Samples:
    sentence_0 sentence_1
    고객: NCF 내야해? 상담사: NCF는 National Carrier Fee로 국가별 추가요금입니다. 요금표 참고해 주세요.
    고객: DLY 수수료는? 상담사: DLY는 지연 수수료입니다. 3시간 이상 지연 시 청구됩니다.
    고객: 티켓 리이슈 가능? 상담사: 네, 고객님. 리이슈—즉 항공권 재발행 도와드릴 수 있습니다. 날짜나 시간이 변경되시면 도와드릴게요.
  • Loss: MultipleNegativesRankingLoss with these parameters:
    {
        "scale": 20.0,
        "similarity_fct": "cos_sim"
    }
    

Training Hyperparameters

Non-Default Hyperparameters

  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • num_train_epochs: 5
  • multi_dataset_batch_sampler: round_robin

All Hyperparameters

Click to expand
  • overwrite_output_dir: False
  • do_predict: False
  • eval_strategy: no
  • prediction_loss_only: True
  • per_device_train_batch_size: 16
  • per_device_eval_batch_size: 16
  • per_gpu_train_batch_size: None
  • per_gpu_eval_batch_size: None
  • gradient_accumulation_steps: 1
  • eval_accumulation_steps: None
  • torch_empty_cache_steps: None
  • learning_rate: 5e-05
  • weight_decay: 0.0
  • adam_beta1: 0.9
  • adam_beta2: 0.999
  • adam_epsilon: 1e-08
  • max_grad_norm: 1
  • num_train_epochs: 5
  • max_steps: -1
  • lr_scheduler_type: linear
  • lr_scheduler_kwargs: {}
  • warmup_ratio: 0.0
  • warmup_steps: 0
  • log_level: passive
  • log_level_replica: warning
  • log_on_each_node: True
  • logging_nan_inf_filter: True
  • save_safetensors: True
  • save_on_each_node: False
  • save_only_model: False
  • restore_callback_states_from_checkpoint: False
  • no_cuda: False
  • use_cpu: False
  • use_mps_device: False
  • seed: 42
  • data_seed: None
  • jit_mode_eval: False
  • use_ipex: False
  • bf16: False
  • fp16: False
  • fp16_opt_level: O1
  • half_precision_backend: auto
  • bf16_full_eval: False
  • fp16_full_eval: False
  • tf32: None
  • local_rank: 0
  • ddp_backend: None
  • tpu_num_cores: None
  • tpu_metrics_debug: False
  • debug: []
  • dataloader_drop_last: False
  • dataloader_num_workers: 0
  • dataloader_prefetch_factor: None
  • past_index: -1
  • disable_tqdm: False
  • remove_unused_columns: True
  • label_names: None
  • load_best_model_at_end: False
  • ignore_data_skip: False
  • fsdp: []
  • fsdp_min_num_params: 0
  • fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}
  • fsdp_transformer_layer_cls_to_wrap: None
  • accelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None}
  • deepspeed: None
  • label_smoothing_factor: 0.0
  • optim: adamw_torch
  • optim_args: None
  • adafactor: False
  • group_by_length: False
  • length_column_name: length
  • ddp_find_unused_parameters: None
  • ddp_bucket_cap_mb: None
  • ddp_broadcast_buffers: False
  • dataloader_pin_memory: True
  • dataloader_persistent_workers: False
  • skip_memory_metrics: True
  • use_legacy_prediction_loop: False
  • push_to_hub: False
  • resume_from_checkpoint: None
  • hub_model_id: None
  • hub_strategy: every_save
  • hub_private_repo: None
  • hub_always_push: False
  • gradient_checkpointing: False
  • gradient_checkpointing_kwargs: None
  • include_inputs_for_metrics: False
  • include_for_metrics: []
  • eval_do_concat_batches: True
  • fp16_backend: auto
  • push_to_hub_model_id: None
  • push_to_hub_organization: None
  • mp_parameters:
  • auto_find_batch_size: False
  • full_determinism: False
  • torchdynamo: None
  • ray_scope: last
  • ddp_timeout: 1800
  • torch_compile: False
  • torch_compile_backend: None
  • torch_compile_mode: None
  • dispatch_batches: None
  • split_batches: None
  • include_tokens_per_second: False
  • include_num_input_tokens_seen: False
  • neftune_noise_alpha: None
  • optim_target_modules: None
  • batch_eval_metrics: False
  • eval_on_start: False
  • use_liger_kernel: False
  • eval_use_gather_object: False
  • average_tokens_across_devices: False
  • prompts: None
  • batch_sampler: batch_sampler
  • multi_dataset_batch_sampler: round_robin

Framework Versions

  • Python: 3.10.12
  • Sentence Transformers: 3.3.1
  • Transformers: 4.48.0
  • PyTorch: 2.7.1+cu126
  • Accelerate: 1.2.1
  • Datasets: 3.2.0
  • Tokenizers: 0.21.2

Citation

BibTeX

Sentence Transformers

@inproceedings{reimers-2019-sentence-bert,
    title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
    author = "Reimers, Nils and Gurevych, Iryna",
    booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
    month = "11",
    year = "2019",
    publisher = "Association for Computational Linguistics",
    url = "https://arxiv.org/abs/1908.10084",
}

MultipleNegativesRankingLoss

@misc{henderson2017efficient,
    title={Efficient Natural Language Response Suggestion for Smart Reply},
    author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil},
    year={2017},
    eprint={1705.00652},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}