설명: Gemini API를 활용해 Google의 최신 AI 모델을 텍스트 및 이미지 기반으로 사용하는 방법을 소개합니다. Python 예제부터 REST API 호출까지 상세한 설명을 제공합니다.
태그: Google Gemini, Gemini API, Google AI, Generative AI, Python, Chat API, Vision AI, Bard
Gemini API란?
Gemini API는 Google이 제공하는 생성형 AI API로, GPT 계열과 유사하게 텍스트, 이미지, 코드 등을 생성할 수 있는 강력한 도구입니다. 현재는 Gemini Pro, Gemini Pro Vision 모델을 중심으로 제공되고 있으며, Python SDK 또는 REST API로 쉽게 사용할 수 있습니다.
기본 준비
- Google Cloud Console에 로그인
- 새 프로젝트 생성
- Gemini API 활성화
- API 키 생성
- 아래 예제를 통해 직접 테스트 가능!
텍스트 입력 예제 (gemini-pro)
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-pro")
response = model.generate_content("Explain quantum mechanics to a 10-year-old.")
print(response.text)
gemini-pro 모델은 고품질 텍스트 생성에 특화되어 있습니다.
이미지 + 텍스트 입력 예제 (gemini-pro-vision)
import google.generativeai as genai
from PIL import Image
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-pro-vision")
img = Image.open("example.jpg") # 예: 음식 사진
response = model.generate_content(
[img, "What kind of food is this and how healthy is it?"]
)
print(response.text)
Vision 모델은 이미지와 텍스트를 함께 이해합니다. OCR, 음식 인식, 제품 분류 등에 활용 가능!
Chat 기반 연속 대화 예제
import google.generativeai as genai
genai.configure(api_key="YOUR_API_KEY")
model = genai.GenerativeModel("gemini-pro")
chat = model.start_chat()
response1 = chat.send_message("Who is Albert Einstein?")
print(response1.text)
response2 = chat.send_message("What were his contributions to quantum theory?")
print(response2.text)
문맥을 유지하며 대화할 수 있는 Chat 기능은 챗봇 제작에 매우 유용합니다.
REST API 직접 호출 (HTTP 요청)
엔드포인트:
POST https://generativelanguage.googleapis.com/v1/models/gemini-pro:generateContent?key=YOUR_API_KEY
cURL 예제:
curl -X POST \
"https://generativelanguage.googleapis.com/v1/models/gemini-pro:generateContent?key=YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [{
"text": "Explain relativity in simple terms."
}]
}]
}'
Postman에서도 위와 같은 JSON으로 요청 가능합니다.
모델 종류 요약
모델 이름 | 기능 |
---|---|
gemini-pro | 텍스트 생성 전용 |
gemini-pro-vision | 이미지 + 텍스트 입력 지원 |
마무리 및 참고 자료
Google Gemini API는 텍스트 기반의 질문응답부터 이미지 분석, 연속 대화 챗봇까지 활용도가 매우 높습니다. WordPress, Flask, FastAPI, Streamlit 등 다양한 플랫폼과도 연동이 가능하니 프로젝트에 적극 활용해 보세요.
Leave a Reply