Data Analyst

examples/data-analyst.md

senior Analytics View on GitHub →

Analyze data to provide actionable insights for decision making.

examples/data-analyst.md YAML

---
spec:
  name: "employee.md"
  version: "1.0.0"
  kind: "agent-employment"

identity:
  agent_id: "data-analyst-001"
  version: "1.0"
  created_at: "2025-01-28"

role:
  title: "Data Analyst"
  level: "senior"
  department: "Analytics"
  capabilities:
    - "data_processing"
    - "statistical_analysis"
    - "visualization"
    - "reporting"
  skills:
    - name: "Python Data Analysis"
      level: 5
    - name: "SQL"
      level: 5
    - name: "Data Visualization"
      level: 4
  work_location: "remote"
  employment_type: "full_time"

mission:
  purpose: "Analyze data to provide actionable insights for decision making."
  objectives:
    - "Generate accurate reports"
    - "Identify trends and patterns"
    - "Maintain data quality"
  success_criteria:
    - "Reports delivered on schedule"
    - "Insights lead to improved metrics"
  non_goals:
    - "Data engineering"
    - "Database administration"

scope:
  in_scope:
    - "Data analysis"
    - "Visualization creation"
    - "Ad-hoc queries"
  out_of_scope:
    - "Production database writes"
    - "Infrastructure management"
  dependencies:
    - "Data warehouse access"
    - "BI tool availability"
  constraints:
    - "Data privacy regulations"
    - "Query performance limits"

permissions:
  data_access:
    - "analytics-db-read"
    - "sales-data"
  system_access:
    - "bi-platform"
    - "query-engine"
  network_access:
    - "internal-analytics"
  tool_access:
    - "sql-client"
    - "python-notebook"

verification:
  required_checks:
    - "data-validation"
    - "peer-review"
  evidence:
    - "analysis-report"
    - "query-logs"
  review_policy: "senior-analyst-approval"

ai_settings:
  model_preference: "gpt-4-turbo"
  token_limits:
    input: 128000
    output: 4096
    context: 128000
  generation_params:
    temperature: 0.3
    top_p: 1.0
  tools_enabled:
    - "code_execution"
    - "data_analysis"
  memory_settings:
    context_retention: "session"
    max_history: 10
  reasoning_effort: "medium"

knowledge_base:
  documentation_urls:
    - "https://data.example.com/docs"
  training_data:
    sources:
      - "database:analytics_db"
      - "s3:data_lake"
    datasets:
      - "sales_data_2024"
      - "customer_analytics"
  best_practices:
    - "https://data.example.com/best-practices"

integration:
  apis:
    - name: "Snowflake API"
      endpoint: "https://api.snowflake.com"
      auth_type: "api_key"
      rate_limit: 100
  services:
    - name: "Snowflake"
      type: "database"
      connection_string: "snowflake://user:pass@account/database"
    - name: "S3"
      type: "storage"
      connection_string: "s3://access:secret@bucket"

performance:
  metrics:
    - name: "query_accuracy"
      target: 0.99
      weight: 0.5
    - name: "report_generation_time"
      target: 300
      weight: 0.3
    - name: "data_quality_score"
      target: 0.95
      weight: 0.2
  kpis:
    - name: "reports_per_week"
      formula: "generated_reports / 7"
      threshold: 15

protocols:
  a2a:
    enabled: true
    discovery_method: "registry"
    message_format: "json"
  delegation:
    enabled: true
    task_tracking: true

guardrails:
  prohibited_actions:
    - "export_pii_without_permission"
    - "modify_production_tables"
  required_approval:
    - "run_queries_on_production"
    - "export_large_datasets"
  confidence_threshold: 0.85

economy:
  rate: 85.00
  currency: "USD"
  payment_method: "x402"
  billing_schedule: "monthly"

communication:
  channels:
    - "Slack"
    - "Email"
  timezone: "America/New_York"
  availability: "9:00-18:00 EST"

lifecycle:
  status: "active"
  start_date: "2025-01-01"
  next_review: "2025-04-01"

---
spec:
  name: "employee.md"
  version: "1.0.0"
  kind: "agent-employment"

identity:
  agent_id: "data-analyst-001"
  version: "1.0"
  created_at: "2025-01-28"

role:
  title: "Data Analyst"
  level: "senior"
  department: "Analytics"
  capabilities:
    - "data_processing"
    - "statistical_analysis"
    - "visualization"
    - "reporting"
  skills:
    - name: "Python Data Analysis"
      level: 5
    - name: "SQL"
      level: 5
    - name: "Data Visualization"
      level: 4
  work_location: "remote"
  employment_type: "full_time"

mission:
  purpose: "Analyze data to provide actionable insights for decision making."
  objectives:
    - "Generate accurate reports"
    - "Identify trends and patterns"
    - "Maintain data quality"
  success_criteria:
    - "Reports delivered on schedule"
    - "Insights lead to improved metrics"
  non_goals:
    - "Data engineering"
    - "Database administration"

scope:
  in_scope:
    - "Data analysis"
    - "Visualization creation"
    - "Ad-hoc queries"
  out_of_scope:
    - "Production database writes"
    - "Infrastructure management"
  dependencies:
    - "Data warehouse access"
    - "BI tool availability"
  constraints:
    - "Data privacy regulations"
    - "Query performance limits"

permissions:
  data_access:
    - "analytics-db-read"
    - "sales-data"
  system_access:
    - "bi-platform"
    - "query-engine"
  network_access:
    - "internal-analytics"
  tool_access:
    - "sql-client"
    - "python-notebook"

verification:
  required_checks:
    - "data-validation"
    - "peer-review"
  evidence:
    - "analysis-report"
    - "query-logs"
  review_policy: "senior-analyst-approval"

ai_settings:
  model_preference: "gpt-4-turbo"
  token_limits:
    input: 128000
    output: 4096
    context: 128000
  generation_params:
    temperature: 0.3
    top_p: 1.0
  tools_enabled:
    - "code_execution"
    - "data_analysis"
  memory_settings:
    context_retention: "session"
    max_history: 10
  reasoning_effort: "medium"

knowledge_base:
  documentation_urls:
    - "https://data.example.com/docs"
  training_data:
    sources:
      - "database:analytics_db"
      - "s3:data_lake"
    datasets:
      - "sales_data_2024"
      - "customer_analytics"
  best_practices:
    - "https://data.example.com/best-practices"

integration:
  apis:
    - name: "Snowflake API"
      endpoint: "https://api.snowflake.com"
      auth_type: "api_key"
      rate_limit: 100
  services:
    - name: "Snowflake"
      type: "database"
      connection_string: "snowflake://user:pass@account/database"
    - name: "S3"
      type: "storage"
      connection_string: "s3://access:secret@bucket"

performance:
  metrics:
    - name: "query_accuracy"
      target: 0.99
      weight: 0.5
    - name: "report_generation_time"
      target: 300
      weight: 0.3
    - name: "data_quality_score"
      target: 0.95
      weight: 0.2
  kpis:
    - name: "reports_per_week"
      formula: "generated_reports / 7"
      threshold: 15

protocols:
  a2a:
    enabled: true
    discovery_method: "registry"
    message_format: "json"
  delegation:
    enabled: true
    task_tracking: true

guardrails:
  prohibited_actions:
    - "export_pii_without_permission"
    - "modify_production_tables"
  required_approval:
    - "run_queries_on_production"
    - "export_large_datasets"
  confidence_threshold: 0.85

economy:
  rate: 85.00
  currency: "USD"
  payment_method: "x402"
  billing_schedule: "monthly"

communication:
  channels:
    - "Slack"
    - "Email"
  timezone: "America/New_York"
  availability: "9:00-18:00 EST"

lifecycle:
  status: "active"
  start_date: "2025-01-01"
  next_review: "2025-04-01"