Meta Llama 3 11B Vision

Meta Llama 3 11B Vision is a large-scale multimodal language model optimized for vision and language tasks, enabling developers and enterprises to build advanced AI applications that integrate visual understanding with natural language processing, with improved accuracy and efficiency over previous models.

Provider: meta-llamaProprietaryNo API

Context: 131.1K

Multimodal