Implement Token Efficiency - Context optimization #24

New Issue

agentson · 2026-02-04T16:14:29+09:00

agentson commented

2026-02-04 16:14:29 +09:00

Goal

Behavioral Rule: Token Efficiency

Optimize LLM token usage to reduce costs and latency while maintaining decision quality.

Background

투자와 무관한 개인 프로필(잡담)은 제거하여 리소스를 아낄 것.

Tasks

1. Prompt Optimization

Remove irrelevant context from prompts
Template-based prompts with variable slots
Compress historical data before sending
Use abbreviations for repeated terms

2. Smart Context Selection

Don't send all L1-L7 every time
L7 (real-time) for normal decisions
L6-L5 (daily/weekly) for strategic decisions
L4-L1 (monthly/legacy) only for major events

3. Context Summarization

Summarize old context instead of raw data
Key metrics only (averages, trends)
Rolling window (keep last N days detailed)
Aggregate older data

4. Response Caching

Cache common Gemini responses
TTL-based cache invalidation
Cache hit rate monitoring
Cache per market conditions

5. Prompt Compression

Token counting before API call
Automatic truncation if too long
Priority-based context inclusion
A/B test compressed vs full prompts

6. Metrics and Monitoring

Track tokens per decision
Cost per decision
Identify expensive prompts
Optimization opportunities

Implementation Files

src/brain/prompt_optimizer.py - Prompt optimization
src/brain/context_selector.py - Smart context selection
src/brain/cache.py - Response caching
src/context/summarizer.py - Context summarization
tests/test_token_efficiency.py - Tests

Target Metrics

Reduce average tokens/decision by 50%
Maintain >85% decision quality
Cache hit rate >30%
Cost/decision < $0.01

Acceptance Criteria

Prompt templates implemented
Smart context selection (L1-L7)
Context summarization working
Response caching with >20% hit rate
Token usage reduced by >40%
Decision quality maintained
Tests achieve ≥80% coverage

Priority

LOW - Cost optimization, not critical for functionality

Behavioral Rule: Token Efficiency
Impacts: Operational costs, latency
Synergy with: Context Tree

## Goal Behavioral Rule: Token Efficiency Optimize LLM token usage to reduce costs and latency while maintaining decision quality. ## Background 투자와 무관한 개인 프로필(잡담)은 제거하여 리소스를 아낄 것. ## Tasks ### 1. Prompt Optimization - Remove irrelevant context from prompts - Template-based prompts with variable slots - Compress historical data before sending - Use abbreviations for repeated terms ### 2. Smart Context Selection - Don't send all L1-L7 every time - L7 (real-time) for normal decisions - L6-L5 (daily/weekly) for strategic decisions - L4-L1 (monthly/legacy) only for major events ### 3. Context Summarization - Summarize old context instead of raw data - Key metrics only (averages, trends) - Rolling window (keep last N days detailed) - Aggregate older data ### 4. Response Caching - Cache common Gemini responses - TTL-based cache invalidation - Cache hit rate monitoring - Cache per market conditions ### 5. Prompt Compression - Token counting before API call - Automatic truncation if too long - Priority-based context inclusion - A/B test compressed vs full prompts ### 6. Metrics and Monitoring - Track tokens per decision - Cost per decision - Identify expensive prompts - Optimization opportunities ## Implementation Files - `src/brain/prompt_optimizer.py` - Prompt optimization - `src/brain/context_selector.py` - Smart context selection - `src/brain/cache.py` - Response caching - `src/context/summarizer.py` - Context summarization - `tests/test_token_efficiency.py` - Tests ## Target Metrics - Reduce average tokens/decision by 50% - Maintain >85% decision quality - Cache hit rate >30% - Cost/decision < $0.01 ## Acceptance Criteria - [ ] Prompt templates implemented - [ ] Smart context selection (L1-L7) - [ ] Context summarization working - [ ] Response caching with >20% hit rate - [ ] Token usage reduced by >40% - [ ] Decision quality maintained - [ ] Tests achieve ≥80% coverage ## Priority **LOW** - Cost optimization, not critical for functionality ## Related Behavioral Rule: Token Efficiency Impacts: Operational costs, latency Synergy with: Context Tree

agentson referenced this issue from a commit

2026-02-04 18:36:06 +09:00

feat: implement token efficiency optimization for issue #24

agentson referenced a pull request that will close this issue

2026-02-04 18:36:33 +09:00

feat: implement Token Efficiency - Context optimization (issue #24) #28

jihoson closed this issue

2026-02-04 18:39:20 +09:00

jihoson referenced this issue from a commit

2026-02-04 18:39:21 +09:00

Merge pull request 'feat: implement Token Efficiency - Context optimization (issue #24)' (#28) from feature/issue-24-token-efficiency into main

Sign in to join this conversation.

Branches Tags

main

feature/v3-session-policy-stream

feature/issue-tkt-p1-008-overnight-killswitch-priority

feature/issue-tkt-p1-007-session-id-ledger

feature/issue-tkt-p1-006-fx-pnl-separation

feature/issue-tkt-p1-005-conservative-fill-model

feature/issue-tkt-p1-002-backtest-cost-mandatory

feature/issue-tkt-p1-004-walkforward-purge-embargo

feature/issue-tkt-p1-001-fx-buffer-guard

feature/issue-tkt-p1-003-triple-barrier-labeler

feature/issue-tkt-p0-002-killswitch-ordering

feature/issue-tkt-p0-001-blackout-queue-revalidate

feature/issue-279-session-order-policy-guard

feature/issue-277-tpm-priority-main-ideation-no-merge-session

feature/issue-275-phase1-state-exit-killswitch

feature/issue-273-multi-agent-governance-docs

feature/issue-271-docs-routing-validation

feature/issue-269-overseas-cash-ovrs-ord-psbl-amt

feature/issue-267-fix-log-warnings

feature/issue-264-265-overseas-cash-and-open-position

feature/issue-259-market-data-pnl-holding-days

feature/issue-261-fix-mock-settings-mode

feature/issue-258-ranking-api-keyb-param

feature/issue-256-fix-overnight-live-mode

feature/issue-254-cleanup-paper-data

feature/issue-251-252-trading-cycle-guards

feature/issue-249-avg-price-sync

feature/issue-247-skip-parse-response-on-prompt-override

feature/issue-245-parse-response-preserve-raw

feature/issue-242-243-gemini-key-fix-overseas-scanner

feature/issue-240-kr-scanner-rank-param-fix

feature/issue-237-dashboard-mode-badge-fix

feature/issue-237-dashboard-mode-badge

feature/issue-235-overseas-balance-ord-psbl-qty

feature/issue-232-domestic-limit-order-pending

feature/issue-229-overseas-pending-order-handling

feature/issue-211-overseas-limit-price-policy

feature/issue-206-startup-position-sync

feature/issue-207-daily-cb-pnl

feature/issue-218-live-trading-docs

feature/issue-217-gemini-model-default

feature/issue-215-evolved-strategy-syntax

feature/issue-209-daily-connection-retry

feature/issue-204-test-coverage-80

feature/issue-212-trades-mode-column

feature/issue-201-202-203-broker-live-mode

feature/issue-210-213-216-db-wal-env-fix

feature/issue-195-overseas-double-buy-prevention

feature/issue-198-dashboard-api-frontend

feature/issue-196-cb-gauge

feature/issue-193-dashboard-positions

feature/issue-191-duplicate-buy-fix

feature/issue-189-overseas-sell-tr-id-fix

feature/issue-187-sell-fat-finger-fix

feature/issue-180-telegram-instance-lock

feature/issue-181-implied-rsi-saturation

feature/issue-178-dashboard-log-order

feature/issue-179-insufficient-balance-cooldown

feature/issue-173-market-outlook-threshold

feature/issue-172-playbook-allocation-sizing

feature/issue-171-position-aware-conditions

feature/issue-170-holdings-in-prompt

feature/issue-164-165-broker-api-holdings

feature/issue-165-holdings-in-trading-loop

feature/issue-164-sell-quantity-fix

feature/issue-163-take-profit-enforcement

feature/issue-161-telegram-notification-filters

feature/issue-159-dashboard-ui-improvement

feature/issue-157-fix-domestic-price-and-tick

feature/issue-155-fix-ranking-api

feature/issue-153-kr-fallback-stocks

feature/issue-151-overseas-order-fixes

feature/issue-149-overseas-limit-order-price

feature/issue-147-overseas-price-balance-fix

feature/issue-145-smart-fallback-playbook

feature/issue-143-fix-prompt-override

feature/issue-141-fix-overseas-ranking-api

fix/137-run-overnight-python-tmux

feat/overseas-ranking-current-state

feature/issue-131-docs-v2-status-sync

feature/issue-132-us-market-telegram-gaps

feature/issue-129-fix-daily-review-test-date

feature/issue-97-dashboard-integration

feature/issue-96-evolution-main-integration

feature/issue-95-evolution-loop

feature/issue-89-legacy-context-cleanup

feature/issue-94-planner-scorecard-injection

feat/v2-2-4-planner-context-crossmarket

feature/issue-93-daily-review-integration

feature/issue-91-daily-reviewer

feature/issue-92-decision-outcome

feature/issue-87-context-scheduler

feature/issue-90-scorecard-model

feature/issue-86-eod-market-filter

feature/issue-85-l7-context-write

feature/issue-114-review-plan-consistency

fix/test-failures

feature/issue-84-main-integration

feature/issue-83-pre-market-planner

feature/issue-81-telegram-playbook-notify

feature/issue-82-playbook-persistence

feature/issue-80-scenario-engine

feature/issue-105-branch-rebase

feature/issue-100-agent-constraints

feature/issue-79-strategy-models

feature/issue-78-config-watchlist-removal

feature/issue-76-smart-volatility-scanner

feature/issue-74-telegram-command-fix

fix/start-command-parsing

feature/issue-69-config-docs

feature/issue-67-status-commands

feature/issue-65-trading-control

feature/issue-63-basic-commands

feature/issue-61-command-handler

feature/issue-59-send-message

feature/issue-57-daily-trading-mode

feature/issue-49-valueerror-empty-string

feature/issue-52-aiohttp-cleanup

feature/issue-54-token-refresh-cooldown

feature/issue-51-api-rate-limiting

feature/issue-44-safe-float

feature/issue-43-reduce-rate-limit

feature/issue-42-token-refresh-lock

feature/issue-41-keyerror-balance

feature/issue-35-telegram-docs

feature/issue-34-main-integration

feature/issue-33-telegram-config

feature/issue-32-telegram-tests

feature/issue-31-telegram-client

feature/issue-23-sustainability

feature/issue-22-data-driven

feature/issue-24-token-efficiency

feature/issue-21-latency-control

feature/issue-19-evolution-engine

feature/issue-20-volatility-hunter

feature/issue-17-decision-logging

feature/issue-15-context-tree

feature/issue-13-docs-refactor

feature/issue-11-command-failures

feature/issue-9-agent-workflow

feature/issue-5-global-market-auto-selection

feature/issue-4-add-git-workflow-policy

feature/issue-2-add-claude-md

1 Participants

Notifications

Due Date

No due date set.

Dependencies

No dependencies set.

Reference: jihoson/The-Ouroboros#24