fix(bedrock): handle ARN and inference profile identifiers without transformation (#48)

roeisavion · web-flow · commit 48556c0a350a · 2025-06-24T08:35:14.000+03:00
Signed-off-by: Roei Savion &lt;r.savion@tricentis.com&gt;
diff --git a/src/providers/bedrock/provider.rs b/src/providers/bedrock/provider.rs
@@ -92,6 +92,31 @@ impl BedrockProvider {
 
         provider_implementation
     }
+
+    fn transform_model_identifier(&self, model: String, model_config: &ModelConfig) -> String {
+        // Check if the model is already an ARN or inference profile ID
+        if model.starts_with("arn:aws:bedrock:") || model.contains("inference-profile") {
+            // Use the model identifier as-is for ARNs and inference profiles
+            model
+        } else {
+            // Transform model name to include provider prefix for regular model IDs
+            let model_provider = model_config.params.get("model_provider").unwrap();
+            let inference_profile_id = self.config.params.get("inference_profile_id");
+            let model_version = model_config
+                .params
+                .get("model_version")
+                .map_or("v1:0", |s| &**s);
+
+            if let Some(profile_id) = inference_profile_id {
+                format!(
+                    "{}.{}.{}-{}",
+                    profile_id, model_provider, model, model_version
+                )
+            } else {
+                format!("{}.{}-{}", model_provider, model, model_version)
+            }
+        }
+    }
 }
 
 #[async_trait]
@@ -120,25 +145,10 @@ impl Provider for BedrockProvider {
             StatusCode::INTERNAL_SERVER_ERROR
         })?;
 
-        // Transform model name to include provider prefix
-        let model_provider = model_config.params.get("model_provider").unwrap();
-        let inference_profile_id = self.config.params.get("inference_profile_id");
         let mut transformed_payload = payload;
-        let model_version = model_config
-            .params
-            .get("model_version")
-            .map_or("v1:0", |s| &**s);
-        transformed_payload.model = if let Some(profile_id) = inference_profile_id {
-            format!(
-                "{}.{}.{}-{}",
-                profile_id, model_provider, transformed_payload.model, model_version
-            )
-        } else {
-            format!(
-                "{}.{}-{}",
-                model_provider, transformed_payload.model, model_version
-            )
-        };
+
+        transformed_payload.model =
+            self.transform_model_identifier(transformed_payload.model, model_config);
 
         self.get_provider_implementation(model_config)
             .chat_completion(&client, transformed_payload)
@@ -155,8 +165,13 @@ impl Provider for BedrockProvider {
             StatusCode::INTERNAL_SERVER_ERROR
         })?;
 
+        let mut transformed_payload = payload;
+
+        transformed_payload.model =
+            self.transform_model_identifier(transformed_payload.model, model_config);
+
         self.get_provider_implementation(model_config)
-            .completion(&client, payload)
+            .completion(&client, transformed_payload)
             .await
     }
 
@@ -170,8 +185,13 @@ impl Provider for BedrockProvider {
             StatusCode::INTERNAL_SERVER_ERROR
         })?;
 
+        let mut transformed_payload = payload;
+
+        transformed_payload.model =
+            self.transform_model_identifier(transformed_payload.model, model_config);
+
         self.get_provider_implementation(model_config)
-            .embedding(&client, payload)
+            .embedding(&client, transformed_payload)
             .await
     }
 }
diff --git a/src/providers/bedrock/test.rs b/src/providers/bedrock/test.rs
@@ -386,6 +386,120 @@ mod ai21_tests {
         }
     }
 }
+
+#[cfg(test)]
+mod arn_tests {
+    use crate::models::chat::ChatCompletionRequest;
+    use crate::models::content::{ChatCompletionMessage, ChatMessageContent};
+    use crate::providers::bedrock::test::{get_test_model_config, get_test_provider_config};
+    use crate::providers::bedrock::BedrockProvider;
+    use crate::providers::provider::Provider;
+
+    #[tokio::test]
+    async fn test_arn_model_identifier_not_transformed() {
+        let config = get_test_provider_config("us-east-1", "anthropic_chat_completion");
+        let provider = BedrockProvider::new(&config);
+
+        // Test with full ARN - should not be transformed
+        let model_config = get_test_model_config(
+            "arn:aws:bedrock:us-east-1:123456789012:inference-profile/us.example.test-model-v1:0",
+            "anthropic",
+        );
+
+        let arn_model =
+            "arn:aws:bedrock:us-east-1:123456789012:inference-profile/us.example.test-model-v1:0";
+        let payload = ChatCompletionRequest {
+            model: arn_model.to_string(),
+            messages: vec![ChatCompletionMessage {
+                role: "user".to_string(),
+                content: Some(ChatMessageContent::String(
+                    "Tell me a short joke".to_string(),
+                )),
+                name: None,
+                tool_calls: None,
+                refusal: None,
+            }],
+            temperature: None,
+            top_p: None,
+            n: None,
+            stream: None,
+            stop: None,
+            max_tokens: None,
+            max_completion_tokens: None,
+            parallel_tool_calls: None,
+            presence_penalty: None,
+            frequency_penalty: None,
+            logit_bias: None,
+            tool_choice: None,
+            tools: None,
+            user: None,
+            logprobs: None,
+            top_logprobs: None,
+            response_format: None,
+        };
+
+        // The test here is that we don't get a transformation error
+        // The mock will handle the actual response
+        let result = provider.chat_completions(payload, &model_config).await;
+
+        // Should not fail due to model identifier transformation
+        assert!(
+            result.is_ok(),
+            "ARN model identifier should be handled correctly: {:?}",
+            result.err()
+        );
+    }
+
+    #[tokio::test]
+    async fn test_inference_profile_identifier_not_transformed() {
+        let config = get_test_provider_config("us-east-1", "anthropic_chat_completion");
+        let provider = BedrockProvider::new(&config);
+
+        // Test with inference profile ID - should not be transformed
+        let model_config = get_test_model_config("us-east-1-inference-profile-123", "anthropic");
+
+        let inference_profile_model = "us-east-1-inference-profile-123";
+        let payload = ChatCompletionRequest {
+            model: inference_profile_model.to_string(),
+            messages: vec![ChatCompletionMessage {
+                role: "user".to_string(),
+                content: Some(ChatMessageContent::String(
+                    "Tell me a short joke".to_string(),
+                )),
+                name: None,
+                tool_calls: None,
+                refusal: None,
+            }],
+            temperature: None,
+            top_p: None,
+            n: None,
+            stream: None,
+            stop: None,
+            max_tokens: None,
+            max_completion_tokens: None,
+            parallel_tool_calls: None,
+            presence_penalty: None,
+            frequency_penalty: None,
+            logit_bias: None,
+            tool_choice: None,
+            tools: None,
+            user: None,
+            logprobs: None,
+            top_logprobs: None,
+            response_format: None,
+        };
+
+        let result = provider.chat_completions(payload, &model_config).await;
+
+        // Should not fail due to model identifier transformation
+        assert!(
+            result.is_ok(),
+            "Inference profile identifier should be handled correctly: {:?}",
+            result.err()
+        );
+    }
+}
+
 /**
 
 Helper functions for creating test clients and mock responses