AgentToolkit · jsntsay · Mar 16, 2026 · Mar 14, 2026 · Mar 16, 2026 · Mar 16, 2026
diff --git a/altk/core/llm/providers/auto_from_env/auto_from_env.py b/altk/core/llm/providers/auto_from_env/auto_from_env.py
@@ -12,7 +12,7 @@ class AutoFromEnvLLMClient(LLMClient):
     Default adapter for ALTK, will determine which provider to use based on environment variables.
 
     Expects the following environment variables to be set:
-        - ALTK_MODEL_NAME: optional, model name, assumes litellm if ALTK_PROVIDER_NAME not set
+        - ALTK_MODEL_NAME: optional, model name, assumes litellm if ALTK_LLM_PROVIDER not set
         - ALTK_LLM_PROVIDER: optional, the corresponding name in the LLMClient registry
     If both are not set, client is set to None
     """
@@ -32,15 +32,15 @@ def __init__(self) -> None:
             provider_type = get_llm(provider_name)
             init_sig = inspect.signature(provider_type)
             if "model_name" in init_sig.parameters:
-                # make sure provider needs provider in init
+                # check if model_name is required for provider
                 if not self.model_name:
                     raise EnvironmentError(
                         "Missing model name which is required for this provider; please set the 'ALTK_MODEL_NAME' environment variable or instantiate an appropriate LLMClient."
                     )
                 self._chosen_provider = provider_type(model_name=self.model_name)
+                self.model_name_in_generate = True
             else:
                 self._chosen_provider = provider_type()
-                self.model_name_in_generate = True
 
     @classmethod
     def provider_class(cls) -> Type[Any]:

diff --git a/altk/post_tool/silent_review/silent_review.py b/altk/post_tool/silent_review/silent_review.py
@@ -17,6 +17,12 @@ class BaseSilentReviewComponent(PostToolReflectionComponent):
 
     def _get_review_args(self, data: SilentReviewRunInput) -> tuple:
         assert isinstance(data.messages, list) and len(data.messages) > 0
+        if "data" in data.messages[0]:
+            return (
+                data.messages[0]["data"]["content"],
+                data.tool_spec,
+                data.tool_response,
+            )
         return (data.messages[0]["content"], data.tool_spec, data.tool_response)
 
     def _run(self, data: SilentReviewRunInput) -> SilentReviewRunOutput:  # type: ignore

diff --git a/examples/langgraph_agent_example.py b/examples/langgraph_agent_example.py
@@ -8,10 +8,18 @@
 """
 
 import random
+import warnings
+import json
 
-from langgraph.prebuilt import create_react_agent
+from langchain_anthropic import ChatAnthropic
+from langgraph.graph import StateGraph, START, END
 from langchain_core.tools import tool
 from typing_extensions import Annotated
+from langgraph.prebuilt import ToolNode
+from langchain_core.messages import BaseMessage, HumanMessage
+from langchain_core.messages.base import messages_to_dict
+import operator
+from typing import TypedDict, List
 from langgraph.prebuilt import InjectedState
 
 from altk.post_tool.silent_review.silent_review import (
@@ -23,6 +31,7 @@
 from dotenv import load_dotenv
 
 load_dotenv()
+warnings.filterwarnings("ignore", category=UserWarning)
 retries = 0
 
 
@@ -36,32 +45,78 @@ def get_weather(city: str, state: Annotated[dict, InjectedState]) -> dict[str, s
     else:
         result = {"weather": f"It's sunny and {random.randint(50, 90)}F in {city}!"}
 
+    return result
+
+
+class AgentState(TypedDict):
+    messages: Annotated[List[BaseMessage], operator.add]
+    next: str
+
+
+def post_tool_hook(state: AgentState) -> AgentState:
+    # Creates a post-tool node that reviews for silent errors
+    global retries
+    tool_response = json.loads(state["messages"][-1].content)
     # Use SilentReview component to check if it's a silent error
     review_input = SilentReviewRunInput(
-        messages=state["messages"], tool_response=result
+        messages=messages_to_dict(state["messages"]), tool_response=tool_response
     )
     reviewer = SilentReviewForJSONDataComponent()
     review_result = reviewer.process(data=review_input, phase=AgentPhase.RUNTIME)
-
     if review_result.outcome == Outcome.NOT_ACCOMPLISHED:
         # Agent should retry tool call if silent error was detected
         print("(ALTK: Silent error detected, retry the get_weather tool!)")
         retries += 1
-        return {"weather": "!!! Silent error detected, RETRY the get_weather tool !!!"}
+        return {
+            "next": "agent",
+            "messages": [
+                HumanMessage(
+                    content="!!! Silent error detected, RETRY the get_weather tool !!!"
+                )
+            ],
+        }
     else:
-        return result
+        return {"next": "final_message"}
 
 
-agent = create_react_agent(
-    model="anthropic:claude-sonnet-4-20250514",
-    tools=[get_weather],
-    prompt="You are a helpful assistant",
-)
+def final_message_node(state):
+    return state
 
-# Runs the agent
-result = agent.invoke(
-    {"messages": [{"role": "user", "content": "what is the weather in sf"}]}
+
+tools = [get_weather]
+llm = ChatAnthropic(model="claude-sonnet-4-20250514")
+llm_with_tools = llm.bind_tools(tools, tool_choice="get_weather")
+
+
+def call_model(state: AgentState):
+    messages = state["messages"]
+    response = llm_with_tools.invoke(messages)
+    return {"messages": [response]}
+
+
+# creates agent with pre-tool node that conditionally goes to tool node
+builder = StateGraph(AgentState)
+builder.add_node("agent", call_model)
+builder.add_node("call_tool", ToolNode(tools))
+builder.add_node("post_tool_hook", post_tool_hook)
+builder.add_node("final_message", final_message_node)
+builder.add_edge(START, "agent")
+builder.add_conditional_edges(
+    "agent",
+    lambda state: "call_tool" if state["messages"][-1].tool_calls else "final_message",
+    {"call_tool": "call_tool", "final_message": "final_message"},
+)
+builder.add_edge("call_tool", "post_tool_hook")
+builder.add_conditional_edges(
+    "post_tool_hook",
+    lambda state: state["next"],
+    {"agent": "agent", "final_message": "final_message"},
 )
+builder.add_edge("final_message", END)
+agent = builder.compile()
+
+# Runs the agent, try running this multiple times to see the ALTK detect the silent error
+result = agent.invoke({"messages": [HumanMessage(content="what is the weather in sf")]})
 print(result["messages"][-1].content)
 if retries > 0:
     print(f"(get_weather was retried: {retries} times)")
diff --git a/examples/langgraph_agent_example_streamlit.py b/examples/langgraph_agent_example_streamlit.py
@@ -9,10 +9,18 @@
 """
 
 import random
+import warnings
+import json
 
-from langgraph.prebuilt import create_react_agent
+from langchain_anthropic import ChatAnthropic
+from langgraph.graph import StateGraph, START, END
 from langchain_core.tools import tool
 from typing_extensions import Annotated
+from langgraph.prebuilt import ToolNode
+from langchain_core.messages import BaseMessage, HumanMessage
+from langchain_core.messages.base import messages_to_dict
+import operator
+from typing import TypedDict, List
 from langgraph.prebuilt import InjectedState
 import streamlit as st
 
@@ -24,6 +32,7 @@
 
 from dotenv import load_dotenv
 
+warnings.filterwarnings("ignore", category=UserWarning)
 load_dotenv()
 tool_silent_error_raised = False
 silent_error_raised = False
@@ -42,36 +51,83 @@ def get_weather(city: str, state: Annotated[dict, InjectedState]) -> dict[str, s
     else:
         result = {"weather": f"It's sunny and {random.randint(50, 90)}F in {city}!"}
 
+    return result
+
+
+class AgentState(TypedDict):
+    messages: Annotated[List[BaseMessage], operator.add]
+    next: str
+
+
+def post_tool_hook(state: AgentState) -> AgentState:
+    # Creates a post-tool node that reviews for silent errors
     if use_silent_review:
+        global retries
+        tool_response = json.loads(state["messages"][-1].content)
         # Use SilentReview component to check if it's a silent error
         review_input = SilentReviewRunInput(
-            messages=state["messages"], tool_response=result
+            messages=messages_to_dict(state["messages"]), tool_response=tool_response
         )
         reviewer = SilentReviewForJSONDataComponent()
         review_result = reviewer.process(data=review_input, phase=AgentPhase.RUNTIME)
-
         if review_result.outcome == Outcome.NOT_ACCOMPLISHED:
             # Agent should retry tool call if silent error was detected
-            print("Silent error detected, retry the get_weather tool!")
+            print("(ALTK: Silent error detected, retry the get_weather tool!)")
+            retries += 1
             global silent_error_raised
             silent_error_raised = True
-            retries += 1
             return {
-                "weather": "!!! Silent error detected, RETRY the get_weather tool !!!"
+                "next": "agent",
+                "messages": [
+                    HumanMessage(
+                        content="!!! Silent error detected, RETRY the get_weather tool !!!"
+                    )
+                ],
             }
         else:
-            return result
+            return {"next": "final_message"}
     else:
-        return result
+        return {"next": "final_message"}
+
 
+def final_message_node(state):
+    return state
 
-agent = create_react_agent(
-    model="anthropic:claude-sonnet-4-20250514",
-    tools=[get_weather],
-    prompt="You are a helpful weather assistant.",
+
+tools = [get_weather]
+llm = ChatAnthropic(model="claude-sonnet-4-20250514")
+llm_with_tools = llm.bind_tools(tools, tool_choice="get_weather")
+
+
+def call_model(state: AgentState):
+    messages = state["messages"]
+    response = llm_with_tools.invoke(messages)
+    return {"messages": [response]}
+
+
+# creates agent with pre-tool node that conditionally goes to tool node
+builder = StateGraph(AgentState)
+builder.add_node("agent", call_model)
+builder.add_node("call_tool", ToolNode(tools))
+builder.add_node("post_tool_hook", post_tool_hook)
+builder.add_node("final_message", final_message_node)
+builder.add_edge(START, "agent")
+builder.add_conditional_edges(
+    "agent",
+    lambda state: "call_tool" if state["messages"][-1].tool_calls else "final_message",
+    {"call_tool": "call_tool", "final_message": "final_message"},
+)
+builder.add_edge("call_tool", "post_tool_hook")
+builder.add_conditional_edges(
+    "post_tool_hook",
+    lambda state: state["next"],
+    {"agent": "agent", "final_message": "final_message"},
 )
+builder.add_edge("final_message", END)
+agent = builder.compile()
+
 
-st.title("ALTK Chatbot example with Silent Review")
+st.title("ALTK Chatbot example with Silent Error Review")
 st.markdown(
     "This demo demonstrates using the ALTK to check for silent errors on an agent. The weather service will randomly silently fail. \
             \n- With Silent Error Review, the silent error is detected and then the agent is suggested to retry. \
@@ -89,10 +145,10 @@ def get_weather(city: str, state: Annotated[dict, InjectedState]) -> dict[str, s
     with st.chat_message("user"):
         st.markdown(prompt)
 
-    st.session_state.messages.append({"role": "user", "content": prompt})
+    st.session_state.messages.append(HumanMessage(content=prompt))
 
     with st.chat_message("assistant"):
-        inputs = {"messages": [("user", prompt)]}
+        inputs = {"messages": [HumanMessage(content=prompt)]}
         result = agent.invoke(inputs)
 
         if tool_silent_error_raised:

diff --git a/examples/langgraph_agent_sparc_example.py b/examples/langgraph_agent_sparc_example.py
@@ -163,9 +163,10 @@ def call_model(state: AgentState):
 builder.add_edge(START, "agent")
 builder.add_conditional_edges(
     "agent",
-    lambda state: "tool_pre_hook"
-    if state["messages"][-1].tool_calls
-    else "final_message",
+    lambda state: (
+        "tool_pre_hook" if state["messages"][-1].tool_calls else "final_message"
+    ),
+    {"tool_pre_hook": "tool_pre_hook", "final_message": "final_message"},
 )
 builder.add_conditional_edges(
     "tool_pre_hook",

diff --git a/examples/langgraph_agent_sparc_example_streamlit.py b/examples/langgraph_agent_sparc_example_streamlit.py
@@ -182,9 +182,9 @@ def call_model(state: AgentState):
 builder.add_edge(START, "agent")
 builder.add_conditional_edges(
     "agent",
-    lambda state: "tool_pre_hook"
-    if state["messages"][-1].tool_calls
-    else "final_message",
+    lambda state: (
+        "tool_pre_hook" if state["messages"][-1].tool_calls else "final_message"
+    ),
 )
 builder.add_conditional_edges(
     "tool_pre_hook",

diff --git a/pyproject.toml b/pyproject.toml
@@ -33,6 +33,7 @@ dependencies = [
     "langchain-text-splitters>=1.0.0",
     "nltk>=3.9.1",
     "scipy>=1.15.3",
+    "onnxruntime==1.23.2 ; python_version == '3.10'", # last version that supports python3.10
 ]
 
 description = "The Agent Lifecycle Toolkit (ALTK) is a library of components to help agent builders improve their agent with minimal integration effort and setup."

diff --git a/tests/post_tool/silent_review_json_data_test.py b/tests/post_tool/silent_review_json_data_test.py
@@ -26,7 +26,7 @@ def build_test_input() -> SilentReviewRunInput:
         },
         tool_response={
             "name": "get_weather",
-            "result": {"city": "NYC", "temperature": "75F", "condition": "Sunny"},
+            "result": {"city": "NYC"},
         },
     )
 
@@ -50,7 +50,7 @@ def test_silent_review_json():
 
     result = middleware.process(data=data, phase=AgentPhase.RUNTIME)
 
-    # the user query is suppposed to mention a city and it doesn't. The fact that we get a response back
+    # the user query is suppposed to mention a temperature and it doesn't. The fact that we get a response back
     # could indicate the presence of a silent error which is why the outcome is 0
     assert result.outcome.value == 0.0
 
@@ -62,6 +62,6 @@ async def test_silent_review_json_async():
     middleware = SilentReviewForJSONDataComponent(config=config)
 
     result = await middleware.aprocess(data=data, phase=AgentPhase.RUNTIME)
-    # the user query is suppposed to mention a city and it doesn't. The fact that we get a response back
+    # the user query is suppposed to mention a temperature and it doesn't. The fact that we get a response back
     # could indicate the presence of a silent error which is why the outcome is 0
     assert result.outcome.value == 0.0
diff --git a/tests/pre_llm/routing/follow_up_detection/test_follow_up.py b/tests/pre_llm/routing/follow_up_detection/test_follow_up.py
@@ -66,8 +66,9 @@ def test_follow_up_detected_by_callback(caplog, llm_client):
                     AIMessage(content="For which year?"),
                 ],
                 user_query="2021",
-                detect_follow_up=lambda messages, user_query: user_query.isdigit()
-                and user_query == "2021",
+                detect_follow_up=lambda messages, user_query: (
+                    user_query.isdigit() and user_query == "2021"
+                ),
             ),
             phase=AgentPhase.RUNTIME,
         )

diff --git a/tests/pre_tool/toolguard/test_toolguard_specs.py b/tests/pre_tool/toolguard/test_toolguard_specs.py
@@ -49,6 +49,7 @@ def out_dir():
 # Main Test
 # ---------------------------------------------------------------------------
 @pytest.mark.asyncio
+@pytest.mark.skip(reason="flaky test")
 async def test_tool_guard_calculator_policy(out_dir: str):
     funcs = [
         divide_tool,