utter-project
/

TowerVideo-9B

Video-Text-to-Text

llava_onevision

image-text-to-text

Model card Files Files and versions

File size: 219 Bytes

{
  "image_token": "<image>",
  "num_image_tokens": 729,
  "processor_class": "LlavaOnevisionProcessor",
  "video_token": "<video>",
  "vision_aspect_ratio": "anyres_max_9",
  "vision_feature_select_strategy": "full"
}