Add config option to select fp16 or quantized jina vision model (#14270)

* Add config option to select fp16 or quantized jina vision model * requires_fp16 for text and large models only * fix model type check * fix cpu * pass model size
2024-10-10 17:46:21 -05:00
parent dd6276e706
commit 54eb03d2a1
7 changed files with 44 additions and 10 deletions
--- a/web/src/pages/Explore.tsx
+++ b/web/src/pages/Explore.tsx
@@ -207,9 +207,12 @@ export default function Explore() {
  const { payload: textTokenizerState } = useModelState(
    "jinaai/jina-clip-v1-tokenizer",
  );
-  const { payload: visionModelState } = useModelState(
-    "jinaai/jina-clip-v1-vision_model_fp16.onnx",
-  );
+  const modelFile =
+    config?.semantic_search.model_size === "large"
+      ? "jinaai/jina-clip-v1-vision_model_fp16.onnx"
+      : "jinaai/jina-clip-v1-vision_model_quantized.onnx";
+
+  const { payload: visionModelState } = useModelState(modelFile);
  const { payload: visionFeatureExtractorState } = useModelState(
    "jinaai/jina-clip-v1-preprocessor_config.json",
  );
--- a/web/src/types/frigateConfig.ts
+++ b/web/src/types/frigateConfig.ts
@@ -417,6 +417,7 @@ export interface FrigateConfig {

  semantic_search: {
    enabled: boolean;
+    model_size: string;
  };

  snapshots: {