Tuklasin natin kung paano mag-perform ng inference gamit ang Phi-3-mini sa mga Android device. Ang Phi-3-mini ay isang bagong serye ng mga modelo mula sa Microsoft na nagbibigay-daan sa pag-deploy ng Large Language Models (LLMs) sa edge devices at IoT devices.
Semantic Kernel ay isang application framework na nagbibigay-daan sa paggawa ng mga application na compatible sa Azure OpenAI Service, OpenAI models, at maging sa mga lokal na modelo. Kung bago ka sa Semantic Kernel, inirerekomenda naming tingnan mo ang Semantic Kernel Cookbook.
Maaari mong pagsamahin ito sa Hugging Face Connector sa Semantic Kernel. Tingnan ang Sample Code.
By default, ito ay tumutugma sa model ID sa Hugging Face. Gayunpaman, maaari ka ring kumonekta sa isang locally built na Phi-3-mini model server.
Maraming gumagamit ang mas pinipiling gumamit ng quantized models upang paganahin ang mga modelo nang lokal. Ang Ollama at LlamaEdge ay nagbibigay-daan sa mga indibidwal na user na tawagan ang iba't ibang quantized models:
Maaari mong direktang patakbuhin ang ollama run Phi-3
o i-configure ito offline sa pamamagitan ng paggawa ng isang Modelfile
na may path patungo sa iyong .gguf
file.
FROM {Add your gguf file path}
TEMPLATE \"\"\"<|user|> .Prompt<|end|> <|assistant|>\"\"\"
PARAMETER stop <|end|>
PARAMETER num_ctx 4096
Kung nais mong gamitin ang mga .gguf
file sa cloud at sa edge devices nang sabay, ang LlamaEdge ay isang mahusay na pagpipilian. Maaari kang tumingin sa sample code upang magsimula.
- I-download ang MLC Chat app (Libre) para sa mga Android phone.
- I-download ang APK file (148MB) at i-install ito sa iyong device.
- I-launch ang MLC Chat app. Makikita mo ang listahan ng mga AI models, kabilang ang Phi-3-mini.
Sa kabuuan, ang Phi-3-mini ay nagbibigay ng kapanapanabik na mga posibilidad para sa generative AI sa mga edge device, at maaari mong simulang tuklasin ang mga kakayahan nito sa Android.
Paunawa:
Ang dokumentong ito ay isinalin gamit ang mga serbisyong AI na nakabatay sa makina. Bagama't sinisikap naming maging tumpak, pakitandaan na ang mga awtomatikong pagsasalin ay maaaring maglaman ng mga pagkakamali o hindi tumpak na impormasyon. Ang orihinal na dokumento sa kanyang katutubong wika ang dapat ituring na opisyal na sanggunian. Para sa mahalagang impormasyon, inirerekomenda ang propesyonal na pagsasalin ng tao. Hindi kami mananagot sa anumang hindi pagkakaunawaan o maling interpretasyon na dulot ng paggamit ng pagsasaling ito.