Feat: implementar sistema de recomendações inteligentes e categorização de workloads

2025-09-29 15:26:09 -03:00
parent 63a284f4b2
commit afc7462b40
7 changed files with 1491 additions and 91 deletions
--- a/app/api/routes.py
+++ b/app/api/routes.py
@@ -9,7 +9,7 @@ from fastapi.responses import FileResponse

 from app.models.resource_models import (
    ClusterReport, NamespaceReport, ExportRequest, 
-    ApplyRecommendationRequest
+    ApplyRecommendationRequest, WorkloadCategory, SmartRecommendation
 )
 from app.services.validation_service import ValidationService
 from app.services.report_service import ReportService
@@ -564,6 +564,173 @@ async def get_pod_historical_analysis(
        logger.error(f"Error getting historical analysis for pod {pod_name} in namespace {namespace}: {e}")
        raise HTTPException(status_code=500, detail=str(e))

+@api_router.get("/smart-recommendations")
+async def get_smart_recommendations(
+    namespace: Optional[str] = None,
+    priority: Optional[str] = None,
+    k8s_client=Depends(get_k8s_client)
+):
+    """Get smart recommendations for workloads"""
+    try:
+        # Collect pods
+        if namespace:
+            namespace_resources = await k8s_client.get_namespace_resources(namespace)
+            pods = namespace_resources.pods
+        else:
+            pods = await k8s_client.get_all_pods()
+        
+        # Get workload categories
+        categories = await validation_service.get_workload_categories(pods)
+        
+        # Get smart recommendations
+        recommendations = await validation_service.get_smart_recommendations(pods)
+        
+        # Filter by priority if specified
+        if priority:
+            recommendations = [
+                r for r in recommendations if r.priority == priority
+            ]
+        
+        return {
+            "recommendations": recommendations,
+            "categories": categories,
+            "total": len(recommendations)
+        }
+        
+    except Exception as e:
+        logger.error(f"Error getting smart recommendations: {e}")
+        raise HTTPException(status_code=500, detail=str(e))
+
+@api_router.get("/workload-categories")
+async def get_workload_categories(
+    namespace: Optional[str] = None,
+    k8s_client=Depends(get_k8s_client)
+):
+    """Get workload categories analysis"""
+    try:
+        # Collect pods
+        if namespace:
+            namespace_resources = await k8s_client.get_namespace_resources(namespace)
+            pods = namespace_resources.pods
+        else:
+            pods = await k8s_client.get_all_pods()
+        
+        # Get workload categories
+        categories = await validation_service.get_workload_categories(pods)
+        
+        # Group by category
+        category_summary = {}
+        for category in categories:
+            cat_type = category.category
+            if cat_type not in category_summary:
+                category_summary[cat_type] = {
+                    "count": 0,
+                    "total_priority_score": 0,
+                    "workloads": []
+                }
+            
+            category_summary[cat_type]["count"] += 1
+            category_summary[cat_type]["total_priority_score"] += category.priority_score
+            category_summary[cat_type]["workloads"].append({
+                "name": category.workload_name,
+                "namespace": category.namespace,
+                "priority_score": category.priority_score,
+                "estimated_impact": category.estimated_impact,
+                "vpa_candidate": category.vpa_candidate
+            })
+        
+        # Calculate average priority scores
+        for cat_type in category_summary:
+            if category_summary[cat_type]["count"] > 0:
+                category_summary[cat_type]["average_priority_score"] = (
+                    category_summary[cat_type]["total_priority_score"] / 
+                    category_summary[cat_type]["count"]
+                )
+        
+        return {
+            "categories": category_summary,
+            "total_workloads": len(categories),
+            "timestamp": datetime.now().isoformat()
+        }
+        
+    except Exception as e:
+        logger.error(f"Error getting workload categories: {e}")
+        raise HTTPException(status_code=500, detail=str(e))
+
+@api_router.get("/validations/smart")
+async def get_smart_validations(
+    namespace: Optional[str] = None,
+    severity: Optional[str] = None,
+    workload_category: Optional[str] = None,
+    page: int = 1,
+    page_size: int = 50,
+    k8s_client=Depends(get_k8s_client)
+):
+    """Get validations with smart analysis and categorization"""
+    try:
+        # Collect pods
+        if namespace:
+            namespace_resources = await k8s_client.get_namespace_resources(namespace)
+            pods = namespace_resources.pods
+        else:
+            pods = await k8s_client.get_all_pods()
+        
+        # Get smart validations
+        all_validations = []
+        for pod in pods:
+            pod_validations = await validation_service.validate_pod_resources_with_smart_analysis(pod)
+            all_validations.extend(pod_validations)
+        
+        # Filter by severity if specified
+        if severity:
+            all_validations = [
+                v for v in all_validations if v.severity == severity
+            ]
+        
+        # Filter by workload category if specified
+        if workload_category:
+            all_validations = [
+                v for v in all_validations if v.workload_category == workload_category
+            ]
+        
+        # Sort by priority score (descending)
+        all_validations.sort(key=lambda x: x.priority_score or 0, reverse=True)
+        
+        # Pagination
+        total = len(all_validations)
+        start = (page - 1) * page_size
+        end = start + page_size
+        paginated_validations = all_validations[start:end]
+        
+        return {
+            "validations": paginated_validations,
+            "pagination": {
+                "page": page,
+                "page_size": page_size,
+                "total": total,
+                "total_pages": (total + page_size - 1) // page_size
+            },
+            "summary": {
+                "total_validations": total,
+                "by_severity": {
+                    "critical": len([v for v in all_validations if v.severity == "critical"]),
+                    "error": len([v for v in all_validations if v.severity == "error"]),
+                    "warning": len([v for v in all_validations if v.severity == "warning"]),
+                    "info": len([v for v in all_validations if v.severity == "info"])
+                },
+                "by_category": {
+                    "new": len([v for v in all_validations if v.workload_category == "new"]),
+                    "established": len([v for v in all_validations if v.workload_category == "established"]),
+                    "outlier": len([v for v in all_validations if v.workload_category == "outlier"]),
+                    "compliant": len([v for v in all_validations if v.workload_category == "compliant"])
+                }
+            }
+        }
+        
+    except Exception as e:
+        logger.error(f"Error getting smart validations: {e}")
+        raise HTTPException(status_code=500, detail=str(e))
+
@api_router.get("/health")
 async def health_check():
    """API health check"""
--- a/app/models/resource_models.py
+++ b/app/models/resource_models.py
@@ -43,6 +43,9 @@ class ResourceValidation(BaseModel):
    severity: str  # "warning", "error", "critical"
    message: str
    recommendation: Optional[str] = None
+    priority_score: Optional[int] = None  # 1-10, higher = more critical
+    workload_category: Optional[str] = None  # "new", "established", "outlier", "compliant"
+    estimated_impact: Optional[str] = None  # "low", "medium", "high", "critical"

 class ClusterReport(BaseModel):
    """Cluster report"""
@@ -80,3 +83,31 @@ class ApplyRecommendationRequest(BaseModel):
    action: str  # "requests", "limits"
    value: str
    dry_run: bool = True
+
+class WorkloadCategory(BaseModel):
+    """Workload categorization"""
+    workload_name: str
+    namespace: str
+    category: str  # "new", "established", "outlier", "compliant"
+    age_days: int
+    resource_config_status: str  # "missing_requests", "missing_limits", "suboptimal_ratio", "compliant"
+    priority_score: int  # 1-10
+    estimated_impact: str  # "low", "medium", "high", "critical"
+    vpa_candidate: bool = False
+    historical_data_available: bool = False
+
+class SmartRecommendation(BaseModel):
+    """Smart recommendation based on analysis"""
+    workload_name: str
+    namespace: str
+    recommendation_type: str  # "resource_config", "vpa_activation", "ratio_adjustment"
+    priority: str  # "critical", "high", "medium", "low"
+    title: str
+    description: str
+    current_config: Optional[Dict[str, str]] = None
+    suggested_config: Optional[Dict[str, str]] = None
+    confidence_level: Optional[float] = None  # 0.0-1.0
+    estimated_impact: Optional[str] = None
+    implementation_steps: Optional[List[str]] = None
+    kubectl_commands: Optional[List[str]] = None
+    vpa_yaml: Optional[str] = None
--- a/app/services/smart_recommendations.py
+++ b/app/services/smart_recommendations.py
@@ -0,0 +1,440 @@
+"""
+Smart recommendations service for resource governance
+"""
+import logging
+from typing import List, Dict, Any, Optional
+from datetime import datetime, timedelta
+from dataclasses import dataclass
+
+from app.models.resource_models import (
+    PodResource, 
+    WorkloadCategory, 
+    SmartRecommendation,
+    ResourceValidation
+)
+from app.services.historical_analysis import HistoricalAnalysisService
+
+logger = logging.getLogger(__name__)
+
+@dataclass
+class WorkloadAnalysis:
+    """Workload analysis data"""
+    workload_name: str
+    namespace: str
+    age_days: int
+    has_requests: bool
+    has_limits: bool
+    has_optimal_ratios: bool
+    resource_usage: Optional[Dict[str, float]] = None
+    historical_data_available: bool = False
+
+class SmartRecommendationsService:
+    """Service for generating smart recommendations"""
+    
+    def __init__(self):
+        self.historical_analysis = HistoricalAnalysisService()
+        self.new_workload_threshold_days = 7
+        self.outlier_cpu_threshold = 0.8  # 80% CPU usage
+        self.outlier_memory_threshold = 0.8  # 80% Memory usage
+    
+    async def categorize_workloads(self, pods: List[PodResource]) -> List[WorkloadCategory]:
+        """Categorize workloads based on age and resource configuration"""
+        categories = []
+        
+        # Group pods by workload (deployment)
+        workloads = self._group_pods_by_workload(pods)
+        
+        for workload_name, workload_pods in workloads.items():
+            if not workload_pods:
+                continue
+                
+            # Analyze workload
+            analysis = await self._analyze_workload(workload_name, workload_pods)
+            
+            # Categorize workload
+            category = self._categorize_workload(analysis)
+            categories.append(category)
+        
+        return categories
+    
+    async def generate_smart_recommendations(
+        self, 
+        pods: List[PodResource],
+        categories: List[WorkloadCategory]
+    ) -> List[SmartRecommendation]:
+        """Generate smart recommendations based on workload analysis"""
+        recommendations = []
+        
+        for category in categories:
+            workload_pods = [p for p in pods if self._extract_workload_name(p.name) == category.workload_name and p.namespace == category.namespace]
+            
+            if not workload_pods:
+                continue
+            
+            # Generate recommendations based on category
+            workload_recommendations = await self._generate_workload_recommendations(
+                category, workload_pods
+            )
+            recommendations.extend(workload_recommendations)
+        
+        # Sort by priority
+        recommendations.sort(key=lambda x: self._get_priority_score(x.priority), reverse=True)
+        
+        return recommendations
+    
+    def _group_pods_by_workload(self, pods: List[PodResource]) -> Dict[str, List[PodResource]]:
+        """Group pods by workload (deployment) name"""
+        workloads = {}
+        
+        for pod in pods:
+            workload_name = self._extract_workload_name(pod.name)
+            if workload_name not in workloads:
+                workloads[workload_name] = []
+            workloads[workload_name].append(pod)
+        
+        return workloads
+    
+    def _extract_workload_name(self, pod_name: str) -> str:
+        """Extract workload name from pod name"""
+        # Remove replica set suffix (e.g., "app-74ffb8c66-9kpdg" -> "app")
+        parts = pod_name.split('-')
+        if len(parts) >= 3 and parts[-2].isalnum() and parts[-1].isalnum():
+            return '-'.join(parts[:-2])
+        return pod_name
+    
+    async def _analyze_workload(self, workload_name: str, pods: List[PodResource]) -> WorkloadAnalysis:
+        """Analyze a workload to determine its characteristics"""
+        if not pods:
+            return WorkloadAnalysis(workload_name, "", 0, False, False, False)
+        
+        # Get namespace from first pod
+        namespace = pods[0].namespace
+        
+        # Calculate age (use oldest pod)
+        oldest_pod = min(pods, key=lambda p: p.creation_timestamp if hasattr(p, 'creation_timestamp') else datetime.now())
+        age_days = 0
+        if hasattr(oldest_pod, 'creation_timestamp'):
+            age_days = (datetime.now() - oldest_pod.creation_timestamp).days
+        
+        # Analyze resource configuration
+        has_requests = all(
+            any(container.resources.get("requests") for container in pod.containers)
+            for pod in pods
+        )
+        
+        has_limits = all(
+            any(container.resources.get("limits") for container in pod.containers)
+            for pod in pods
+        )
+        
+        # Check for optimal ratios (simplified)
+        has_optimal_ratios = True
+        for pod in pods:
+            for container in pod.containers:
+                resources = container.resources
+                requests = resources.get("requests", {})
+                limits = resources.get("limits", {})
+                
+                if requests and limits:
+                    # Check CPU ratio
+                    if "cpu" in requests and "cpu" in limits:
+                        try:
+                            cpu_request = self._parse_cpu_value(requests["cpu"])
+                            cpu_limit = self._parse_cpu_value(limits["cpu"])
+                            if cpu_request > 0 and cpu_limit / cpu_request > 5.0:  # > 5:1 ratio
+                                has_optimal_ratios = False
+                        except:
+                            pass
+                    
+                    # Check memory ratio
+                    if "memory" in requests and "memory" in limits:
+                        try:
+                            mem_request = self._parse_memory_value(requests["memory"])
+                            mem_limit = self._parse_memory_value(limits["memory"])
+                            if mem_request > 0 and mem_limit / mem_request > 5.0:  # > 5:1 ratio
+                                has_optimal_ratios = False
+                        except:
+                            pass
+        
+        # Check historical data availability
+        historical_data_available = False
+        try:
+            # Try to get historical data for the workload
+            historical_data = await self.historical_analysis.get_workload_historical_analysis(
+                namespace, workload_name, "7d"
+            )
+            historical_data_available = not historical_data.get('error')
+        except:
+            pass
+        
+        return WorkloadAnalysis(
+            workload_name=workload_name,
+            namespace=namespace,
+            age_days=age_days,
+            has_requests=has_requests,
+            has_limits=has_limits,
+            has_optimal_ratios=has_optimal_ratios,
+            historical_data_available=historical_data_available
+        )
+    
+    def _categorize_workload(self, analysis: WorkloadAnalysis) -> WorkloadCategory:
+        """Categorize workload based on analysis"""
+        # Determine category
+        if analysis.age_days < self.new_workload_threshold_days:
+            category = "new"
+        elif not analysis.has_requests or not analysis.has_limits:
+            category = "outlier"
+        elif not analysis.has_optimal_ratios:
+            category = "outlier"
+        else:
+            category = "compliant"
+        
+        # Determine resource config status
+        if not analysis.has_requests:
+            resource_status = "missing_requests"
+        elif not analysis.has_limits:
+            resource_status = "missing_limits"
+        elif not analysis.has_optimal_ratios:
+            resource_status = "suboptimal_ratio"
+        else:
+            resource_status = "compliant"
+        
+        # Calculate priority score
+        priority_score = self._calculate_priority_score(analysis, category, resource_status)
+        
+        # Determine estimated impact
+        estimated_impact = self._determine_impact(priority_score, category)
+        
+        # Determine if VPA candidate
+        vpa_candidate = (
+            category == "new" or 
+            (category == "outlier" and not analysis.historical_data_available)
+        )
+        
+        return WorkloadCategory(
+            workload_name=analysis.workload_name,
+            namespace=analysis.namespace,
+            category=category,
+            age_days=analysis.age_days,
+            resource_config_status=resource_status,
+            priority_score=priority_score,
+            estimated_impact=estimated_impact,
+            vpa_candidate=vpa_candidate,
+            historical_data_available=analysis.historical_data_available
+        )
+    
+    def _calculate_priority_score(self, analysis: WorkloadAnalysis, category: str, resource_status: str) -> int:
+        """Calculate priority score (1-10) for workload"""
+        score = 1
+        
+        # Base score by category
+        if category == "outlier":
+            score += 4
+        elif category == "new":
+            score += 2
+        
+        # Add score by resource status
+        if resource_status == "missing_requests":
+            score += 3
+        elif resource_status == "missing_limits":
+            score += 2
+        elif resource_status == "suboptimal_ratio":
+            score += 1
+        
+        # Add score for production namespaces
+        if analysis.namespace in ["default", "production", "prod"]:
+            score += 2
+        
+        # Add score for age (older workloads are more critical)
+        if analysis.age_days > 30:
+            score += 1
+        
+        return min(score, 10)
+    
+    def _determine_impact(self, priority_score: int, category: str) -> str:
+        """Determine estimated impact based on priority score and category"""
+        if priority_score >= 8:
+            return "critical"
+        elif priority_score >= 6:
+            return "high"
+        elif priority_score >= 4:
+            return "medium"
+        else:
+            return "low"
+    
+    async def _generate_workload_recommendations(
+        self, 
+        category: WorkloadCategory, 
+        pods: List[PodResource]
+    ) -> List[SmartRecommendation]:
+        """Generate recommendations for a specific workload"""
+        recommendations = []
+        
+        if category.category == "new":
+            # New workload recommendations
+            recommendations.append(self._create_vpa_activation_recommendation(category))
+        
+        elif category.category == "outlier":
+            if category.resource_config_status == "missing_requests":
+                recommendations.append(self._create_missing_requests_recommendation(category, pods))
+            elif category.resource_config_status == "missing_limits":
+                recommendations.append(self._create_missing_limits_recommendation(category, pods))
+            elif category.resource_config_status == "suboptimal_ratio":
+                recommendations.append(self._create_ratio_adjustment_recommendation(category, pods))
+        
+        # Add VPA recommendation for outliers without historical data
+        if category.vpa_candidate and not category.historical_data_available:
+            recommendations.append(self._create_vpa_activation_recommendation(category))
+        
+        return recommendations
+    
+    def _create_vpa_activation_recommendation(self, category: WorkloadCategory) -> SmartRecommendation:
+        """Create VPA activation recommendation"""
+        return SmartRecommendation(
+            workload_name=category.workload_name,
+            namespace=category.namespace,
+            recommendation_type="vpa_activation",
+            priority=category.estimated_impact,
+            title=f"Activate VPA for {category.workload_name}",
+            description=f"Enable VPA for {category.workload_name} to get automatic resource recommendations based on usage patterns.",
+            confidence_level=0.8 if category.historical_data_available else 0.6,
+            estimated_impact=category.estimated_impact,
+            implementation_steps=[
+                f"Create VPA resource for {category.workload_name}",
+                "Set updateMode to 'Off' for recommendation-only mode",
+                "Monitor VPA recommendations for 24-48 hours",
+                "Apply recommended values when confident"
+            ],
+            kubectl_commands=[
+                f"kubectl create -f vpa-{category.workload_name}.yaml"
+            ],
+            vpa_yaml=self._generate_vpa_yaml(category)
+        )
+    
+    def _create_missing_requests_recommendation(self, category: WorkloadCategory, pods: List[PodResource]) -> SmartRecommendation:
+        """Create missing requests recommendation"""
+        return SmartRecommendation(
+            workload_name=category.workload_name,
+            namespace=category.namespace,
+            recommendation_type="resource_config",
+            priority=category.estimated_impact,
+            title=f"Add Resource Requests for {category.workload_name}",
+            description=f"Define CPU and memory requests for {category.workload_name} to guarantee QoS and enable proper scheduling.",
+            confidence_level=0.9,
+            estimated_impact=category.estimated_impact,
+            implementation_steps=[
+                f"Analyze current resource usage for {category.workload_name}",
+                "Set CPU requests based on P95 usage + 20% buffer",
+                "Set memory requests based on P95 usage + 20% buffer",
+                "Update deployment with new resource requests"
+            ],
+            kubectl_commands=[
+                f"kubectl patch deployment {category.workload_name} -n {category.namespace} -p '{{\"spec\":{{\"template\":{{\"spec\":{{\"containers\":[{{\"name\":\"{category.workload_name}\",\"resources\":{{\"requests\":{{\"cpu\":\"200m\",\"memory\":\"512Mi\"}}}}}}]}}}}}}}}'"
+            ]
+        )
+    
+    def _create_missing_limits_recommendation(self, category: WorkloadCategory, pods: List[PodResource]) -> SmartRecommendation:
+        """Create missing limits recommendation"""
+        return SmartRecommendation(
+            workload_name=category.workload_name,
+            namespace=category.namespace,
+            recommendation_type="resource_config",
+            priority=category.estimated_impact,
+            title=f"Add Resource Limits for {category.workload_name}",
+            description=f"Define CPU and memory limits for {category.workload_name} to prevent excessive resource consumption.",
+            confidence_level=0.9,
+            estimated_impact=category.estimated_impact,
+            implementation_steps=[
+                f"Analyze current resource usage for {category.workload_name}",
+                "Set CPU limits based on P95 usage * 3 (3:1 ratio)",
+                "Set memory limits based on P95 usage * 3 (3:1 ratio)",
+                "Update deployment with new resource limits"
+            ],
+            kubectl_commands=[
+                f"kubectl patch deployment {category.workload_name} -n {category.namespace} -p '{{\"spec\":{{\"template\":{{\"spec\":{{\"containers\":[{{\"name\":\"{category.workload_name}\",\"resources\":{{\"limits\":{{\"cpu\":\"600m\",\"memory\":\"1536Mi\"}}}}}}]}}}}}}}}'"
+            ]
+        )
+    
+    def _create_ratio_adjustment_recommendation(self, category: WorkloadCategory, pods: List[PodResource]) -> SmartRecommendation:
+        """Create ratio adjustment recommendation"""
+        return SmartRecommendation(
+            workload_name=category.workload_name,
+            namespace=category.namespace,
+            recommendation_type="ratio_adjustment",
+            priority=category.estimated_impact,
+            title=f"Adjust Resource Ratios for {category.workload_name}",
+            description=f"Optimize CPU and memory limit:request ratios for {category.workload_name} to follow best practices (3:1 ratio).",
+            confidence_level=0.8,
+            estimated_impact=category.estimated_impact,
+            implementation_steps=[
+                f"Analyze current resource ratios for {category.workload_name}",
+                "Adjust limits to maintain 3:1 ratio with requests",
+                "Test with updated ratios in staging environment",
+                "Apply changes to production"
+            ],
+            kubectl_commands=[
+                f"kubectl patch deployment {category.workload_name} -n {category.namespace} -p '{{\"spec\":{{\"template\":{{\"spec\":{{\"containers\":[{{\"name\":\"{category.workload_name}\",\"resources\":{{\"requests\":{{\"cpu\":\"200m\",\"memory\":\"512Mi\"}},\"limits\":{{\"cpu\":\"600m\",\"memory\":\"1536Mi\"}}}}}}]}}}}}}}}'"
+            ]
+        )
+    
+    def _generate_vpa_yaml(self, category: WorkloadCategory) -> str:
+        """Generate VPA YAML for workload"""
+        return f"""apiVersion: autoscaling.k8s.io/v1
+kind: VerticalPodAutoscaler
+metadata:
+  name: {category.workload_name}-vpa
+  namespace: {category.namespace}
+spec:
+  targetRef:
+    apiVersion: apps/v1
+    kind: Deployment
+    name: {category.workload_name}
+  updatePolicy:
+    updateMode: "Off"  # Recommendation only
+  resourcePolicy:
+    containerPolicies:
+    - containerName: {category.workload_name}
+      maxAllowed:
+        cpu: 2
+        memory: 4Gi
+      minAllowed:
+        cpu: 100m
+        memory: 128Mi"""
+    
+    def _get_priority_score(self, priority: str) -> int:
+        """Convert priority string to numeric score for sorting"""
+        priority_map = {
+            "critical": 4,
+            "high": 3,
+            "medium": 2,
+            "low": 1
+        }
+        return priority_map.get(priority, 0)
+    
+    def _parse_cpu_value(self, value: str) -> float:
+        """Convert CPU value to float (cores)"""
+        if value.endswith('m'):
+            return float(value[:-1]) / 1000
+        elif value.endswith('n'):
+            return float(value[:-1]) / 1000000000
+        else:
+            return float(value)
+    
+    def _parse_memory_value(self, value: str) -> int:
+        """Convert memory value to bytes"""
+        value = value.upper()
+        
+        if value.endswith('KI'):
+            return int(float(value[:-2]) * 1024)
+        elif value.endswith('MI'):
+            return int(float(value[:-2]) * 1024 * 1024)
+        elif value.endswith('GI'):
+            return int(float(value[:-2]) * 1024 * 1024 * 1024)
+        elif value.endswith('K'):
+            return int(float(value[:-1]) * 1000)
+        elif value.endswith('M'):
+            return int(float(value[:-1]) * 1000 * 1000)
+        elif value.endswith('G'):
+            return int(float(value[:-1]) * 1000 * 1000 * 1000)
+        else:
+            return int(value)
--- a/app/services/validation_service.py
+++ b/app/services/validation_service.py
@@ -9,6 +9,7 @@ import re
 from app.models.resource_models import PodResource, ResourceValidation, NamespaceResources
 from app.core.config import settings
 from app.services.historical_analysis import HistoricalAnalysisService
+from app.services.smart_recommendations import SmartRecommendationsService

 logger = logging.getLogger(__name__)

@@ -21,6 +22,7 @@ class ValidationService:
        self.min_cpu_request = settings.min_cpu_request
        self.min_memory_request = settings.min_memory_request
        self.historical_analysis = HistoricalAnalysisService()
+        self.smart_recommendations = SmartRecommendationsService()
    
    def validate_pod_resources(self, pod: PodResource) -> List[ResourceValidation]:
        """Validate pod resources"""
@@ -365,3 +367,124 @@ class ValidationService:
            )
        
        return recommendations
+    
+    async def validate_pod_resources_with_categorization(
+        self, 
+        pod: PodResource, 
+        workload_category: str = None,
+        priority_score: int = None
+    ) -> List[ResourceValidation]:
+        """Validate pod resources with enhanced categorization and scoring"""
+        validations = self.validate_pod_resources(pod)
+        
+        # Add categorization and scoring to validations
+        for validation in validations:
+            validation.workload_category = workload_category
+            validation.priority_score = priority_score or self._calculate_priority_score(validation)
+            validation.estimated_impact = self._determine_impact(validation.priority_score)
+        
+        return validations
+    
+    async def validate_pod_resources_with_smart_analysis(
+        self, 
+        pod: PodResource, 
+        time_range: str = '24h'
+    ) -> List[ResourceValidation]:
+        """Validate pod resources with smart analysis including historical data"""
+        # Static validations
+        static_validations = self.validate_pod_resources(pod)
+        
+        # Get workload category
+        workload_category = await self._categorize_workload(pod)
+        
+        # Get smart recommendations
+        smart_recommendations = await self.smart_recommendations.generate_smart_recommendations([pod], [workload_category])
+        
+        # Enhance validations with smart analysis
+        enhanced_validations = []
+        for validation in static_validations:
+            validation.workload_category = workload_category.category
+            validation.priority_score = self._calculate_priority_score(validation)
+            validation.estimated_impact = self._determine_impact(validation.priority_score)
+            enhanced_validations.append(validation)
+        
+        # Add smart recommendations as validations
+        for recommendation in smart_recommendations:
+            smart_validation = ResourceValidation(
+                pod_name=pod.name,
+                namespace=pod.namespace,
+                container_name="workload",
+                validation_type="smart_recommendation",
+                severity=recommendation.priority,
+                message=recommendation.title,
+                recommendation=recommendation.description,
+                priority_score=self._get_priority_score_from_string(recommendation.priority),
+                workload_category=workload_category.category,
+                estimated_impact=recommendation.estimated_impact
+            )
+            enhanced_validations.append(smart_validation)
+        
+        return enhanced_validations
+    
+    async def _categorize_workload(self, pod: PodResource) -> Any:
+        """Categorize a single workload"""
+        categories = await self.smart_recommendations.categorize_workloads([pod])
+        return categories[0] if categories else None
+    
+    def _get_priority_score_from_string(self, priority: str) -> int:
+        """Convert priority string to numeric score"""
+        priority_map = {
+            "critical": 10,
+            "high": 8,
+            "medium": 5,
+            "low": 2
+        }
+        return priority_map.get(priority, 5)
+    
+    def _calculate_priority_score(self, validation: ResourceValidation) -> int:
+        """Calculate priority score for validation (1-10)"""
+        score = 1
+        
+        # Base score by severity
+        if validation.severity == "critical":
+            score += 4
+        elif validation.severity == "error":
+            score += 3
+        elif validation.severity == "warning":
+            score += 1
+        
+        # Add score by validation type
+        if validation.validation_type == "missing_requests":
+            score += 3
+        elif validation.validation_type == "missing_limits":
+            score += 2
+        elif validation.validation_type == "invalid_ratio":
+            score += 1
+        elif validation.validation_type == "overcommit":
+            score += 4
+        
+        # Add score for production namespaces
+        if validation.namespace in ["default", "production", "prod"]:
+            score += 2
+        
+        return min(score, 10)
+    
+    def _determine_impact(self, priority_score: int) -> str:
+        """Determine estimated impact based on priority score"""
+        if priority_score >= 8:
+            return "critical"
+        elif priority_score >= 6:
+            return "high"
+        elif priority_score >= 4:
+            return "medium"
+        else:
+            return "low"
+    
+    async def get_workload_categories(self, pods: List[PodResource]) -> List[Any]:
+        """Get workload categories for all pods"""
+        return await self.smart_recommendations.categorize_workloads(pods)
+    
+    async def get_smart_recommendations(self, pods: List[PodResource]) -> List[Any]:
+        """Get smart recommendations for all workloads"""
+        categories = await self.get_workload_categories(pods)
+        return await self.smart_recommendations.generate_smart_recommendations(pods, categories)
--- a/app/static/index.html
+++ b/app/static/index.html
@@ -802,6 +802,157 @@
            width: auto;
        }

+        /* Smart Recommendations Styles */
+        .validation-details {
+            display: flex;
+            gap: 1rem;
+            margin: 0.5rem 0;
+            flex-wrap: wrap;
+        }
+
+        .detail-item {
+            font-size: 0.9rem;
+            color: #666;
+        }
+
+        .implementation-steps {
+            margin: 1rem 0;
+            padding: 1rem;
+            background: #f8f9fa;
+            border-radius: 6px;
+            border-left: 4px solid #007bff;
+        }
+
+        .implementation-steps ol {
+            margin: 0.5rem 0 0 1rem;
+        }
+
+        .implementation-steps li {
+            margin: 0.25rem 0;
+        }
+
+        .kubectl-commands {
+            margin: 1rem 0;
+            padding: 1rem;
+            background: #f8f9fa;
+            border-radius: 6px;
+            border-left: 4px solid #28a745;
+        }
+
+        .kubectl-commands pre {
+            margin: 0.5rem 0 0 0;
+            background: #2d3748;
+            color: #e2e8f0;
+            padding: 0.75rem;
+            border-radius: 4px;
+            overflow-x: auto;
+            font-size: 0.85rem;
+        }
+
+        .vpa-yaml {
+            margin: 1rem 0;
+            padding: 1rem;
+            background: #f8f9fa;
+            border-radius: 6px;
+            border-left: 4px solid #ffc107;
+        }
+
+        .vpa-yaml pre {
+            margin: 0.5rem 0 0 0;
+            background: #2d3748;
+            color: #e2e8f0;
+            padding: 0.75rem;
+            border-radius: 4px;
+            overflow-x: auto;
+            font-size: 0.85rem;
+        }
+
+        /* Workload Categories Styles */
+        .workload-list {
+            padding: 1rem 0;
+        }
+
+        .workload-item {
+            background: #f8f9fa;
+            border: 1px solid #e9ecef;
+            border-radius: 6px;
+            padding: 1rem;
+            margin-bottom: 0.75rem;
+        }
+
+        .workload-header {
+            display: flex;
+            justify-content: space-between;
+            align-items: center;
+            margin-bottom: 0.5rem;
+        }
+
+        .workload-name {
+            font-weight: 600;
+            color: #cc0000;
+            font-size: 1.1rem;
+        }
+
+        .workload-namespace {
+            color: #666;
+            font-size: 0.9rem;
+        }
+
+        .workload-details {
+            display: grid;
+            grid-template-columns: repeat(auto-fit, minmax(200px, 1fr));
+            gap: 0.75rem;
+        }
+
+        .workload-stat {
+            font-size: 0.9rem;
+        }
+
+        .badge {
+            padding: 0.25rem 0.5rem;
+            border-radius: 12px;
+            font-size: 0.8rem;
+            font-weight: bold;
+            text-transform: uppercase;
+        }
+
+        .badge.success {
+            background: #d4edda;
+            color: #155724;
+        }
+
+        .badge.info {
+            background: #d1ecf1;
+            color: #0c5460;
+        }
+
+        .badge.warning {
+            background: #fff3cd;
+            color: #856404;
+        }
+
+        .badge.error {
+            background: #f8d7da;
+            color: #721c24;
+        }
+
+        .badge.critical {
+            background: #f8d7da;
+            color: #721c24;
+            font-weight: bold;
+        }
+
+        /* Severity Info */
+        .severity-info {
+            background: #d1ecf1;
+            color: #0c5460;
+        }
+
+        .severity-badge.severity-info {
+            background: #d1ecf1;
+            color: #0c5460;
+        }
+
        @media (max-width: 768px) {
            .container {
                padding: 1rem;
@@ -849,9 +1000,17 @@
                <span class="nav-icon">📈</span>
                <span class="nav-text">Historical Resource Usage</span>
            </a>
-            <a href="#" class="nav-item" data-section="vpa-recommendations">
+            <a href="#" class="nav-item" data-section="smart-recommendations">
                <span class="nav-icon">🎯</span>
-                <span class="nav-text">VPA Recommendations</span>
+                <span class="nav-text">Smart Recommendations</span>
+            </a>
+            <a href="#" class="nav-item" data-section="workload-categories">
+                <span class="nav-icon">📊</span>
+                <span class="nav-text">Workload Analysis</span>
+            </a>
+            <a href="#" class="nav-item" data-section="vpa-recommendations">
+                <span class="nav-icon">⚙️</span>
+                <span class="nav-text">VPA Management</span>
            </a>
        </nav>
    </div>
@@ -960,9 +1119,62 @@
            <div id="pagination" class="pagination"></div>
        </div>

-        <!-- Recomendações VPA -->
+        <!-- Smart Recommendations -->
+        <div class="card" id="smartRecommendationsCard" style="display: none;">
+            <h2>Smart Recommendations</h2>
+            
+            <!-- Filters -->
+            <div class="filters">
+                <div class="filter-group">
+                    <label for="recommendationPriorityFilter">Priority:</label>
+                    <select id="recommendationPriorityFilter">
+                        <option value="">All</option>
+                        <option value="critical">Critical</option>
+                        <option value="high">High</option>
+                        <option value="medium">Medium</option>
+                        <option value="low">Low</option>
+                    </select>
+                </div>
+                <div class="filter-group">
+                    <label for="recommendationTypeFilter">Type:</label>
+                    <select id="recommendationTypeFilter">
+                        <option value="">All</option>
+                        <option value="resource_config">Resource Configuration</option>
+                        <option value="vpa_activation">VPA Activation</option>
+                        <option value="ratio_adjustment">Ratio Adjustment</option>
+                    </select>
+                </div>
+                <button class="btn" onclick="loadSmartRecommendations()">Apply Filters</button>
+            </div>
+            
+            <div id="smartRecommendationsList"></div>
+        </div>
+
+        <!-- Workload Categories -->
+        <div class="card" id="workloadCategoriesCard" style="display: none;">
+            <h2>Workload Analysis</h2>
+            
+            <!-- Filters -->
+            <div class="filters">
+                <div class="filter-group">
+                    <label for="categoryFilter">Category:</label>
+                    <select id="categoryFilter">
+                        <option value="">All</option>
+                        <option value="new">New Workloads</option>
+                        <option value="established">Established</option>
+                        <option value="outlier">Outliers</option>
+                        <option value="compliant">Compliant</option>
+                    </select>
+                </div>
+                <button class="btn" onclick="loadWorkloadCategories()">Apply Filters</button>
+            </div>
+            
+            <div id="workloadCategoriesList"></div>
+        </div>
+
+        <!-- VPA Management -->
        <div class="card" id="vpaCard" style="display: none;">
-            <h2>VPA Recommendations</h2>
+            <h2>VPA Management</h2>
            <div id="vpaList"></div>
        </div>

@@ -1215,8 +1427,28 @@
                    throw new Error(`HTTP ${response.status}: ${response.statusText}`);
                }
                
-                const result = await response.json();
-                showSuccess(`Report exported: ${result.filepath}`);
+                // Get filename from Content-Disposition header
+                const contentDisposition = response.headers.get('Content-Disposition');
+                let filename = 'report.csv';
+                if (contentDisposition) {
+                    const filenameMatch = contentDisposition.match(/filename="(.+)"/);
+                    if (filenameMatch) {
+                        filename = filenameMatch[1];
+                    }
+                }
+                
+                // Download the file
+                const blob = await response.blob();
+                const url = window.URL.createObjectURL(blob);
+                const a = document.createElement('a');
+                a.href = url;
+                a.download = filename;
+                document.body.appendChild(a);
+                a.click();
+                window.URL.revokeObjectURL(url);
+                document.body.removeChild(a);
+                
+                showSuccess(`Report exported: ${filename}`);
                
            } catch (error) {
                showError('Error exporting report: ' + error.message);
@@ -2001,54 +2233,6 @@
            document.getElementById('exportModal').classList.remove('show');
        }

-        async function exportReport() {
-            const format = document.getElementById('exportFormat').value;
-            const namespaces = document.getElementById('exportNamespaces').value;
-            const includeVPA = document.getElementById('includeVPA').checked;
-            const includeValidations = document.getElementById('includeValidations').checked;
-
-            try {
-                const response = await fetch('/api/v1/export', {
-                    method: 'POST',
-                    headers: {
-                        'Content-Type': 'application/json',
-                    },
-                    body: JSON.stringify({
-                        format: format,
-                        namespaces: namespaces ? namespaces.split(',').map(ns => ns.trim()) : null,
-                        include_vpa: includeVPA,
-                        include_validations: includeValidations
-                    })
-                });
-
-                if (!response.ok) {
-                    throw new Error(`HTTP ${response.status}: ${response.statusText}`);
-                }
-
-                // Get filename from response headers
-                const contentDisposition = response.headers.get('Content-Disposition');
-                const filename = contentDisposition 
-                    ? contentDisposition.split('filename=')[1].replace(/"/g, '')
-                    : `report.${format}`;
-
-                // Download the file
-                const blob = await response.blob();
-                const url = window.URL.createObjectURL(blob);
-                const a = document.createElement('a');
-                a.href = url;
-                a.download = filename;
-                document.body.appendChild(a);
-                a.click();
-                window.URL.revokeObjectURL(url);
-                document.body.removeChild(a);
-
-                closeExportModal();
-                showSuccess('Report exported successfully!');
-
-            } catch (error) {
-                showError('Error exporting report: ' + error.message);
-            }
-        }

        // Close export modal when clicking outside
        document.getElementById('exportModal').addEventListener('click', function(e) {
@@ -2056,6 +2240,281 @@
                closeExportModal();
            }
        });
+
+        // Smart Recommendations Functions
+        async function loadSmartRecommendations() {
+            showLoading();
+            
+            try {
+                const priority = document.getElementById('recommendationPriorityFilter').value;
+                const type = document.getElementById('recommendationTypeFilter').value;
+                
+                const params = new URLSearchParams();
+                if (priority) params.append('priority', priority);
+                
+                const response = await fetch(`/api/v1/smart-recommendations?${params}`);
+                if (!response.ok) {
+                    throw new Error(`HTTP ${response.status}: ${response.statusText}`);
+                }
+                
+                const data = await response.json();
+                displaySmartRecommendations(data, type);
+                document.getElementById('smartRecommendationsCard').style.display = 'block';
+                
+            } catch (error) {
+                showError('Error loading smart recommendations: ' + error.message);
+            } finally {
+                hideLoading();
+            }
+        }
+
+        function displaySmartRecommendations(data, typeFilter) {
+            const container = document.getElementById('smartRecommendationsList');
+            
+            if (!data.recommendations || data.recommendations.length === 0) {
+                container.innerHTML = '<p>No smart recommendations found.</p>';
+                return;
+            }
+            
+            let recommendations = data.recommendations;
+            
+            // Filter by type if specified
+            if (typeFilter) {
+                recommendations = recommendations.filter(r => r.recommendation_type === typeFilter);
+            }
+            
+            if (recommendations.length === 0) {
+                container.innerHTML = '<p>No recommendations match the selected filters.</p>';
+                return;
+            }
+            
+            let html = '';
+            
+            recommendations.forEach(rec => {
+                const priorityClass = `severity-${rec.priority}`;
+                const confidenceLevel = rec.confidence_level ? `${(rec.confidence_level * 100).toFixed(0)}%` : 'N/A';
+                
+                html += `
+                    <div class="validation-item ${rec.priority}">
+                        <div class="validation-header">
+                            <span class="severity-badge ${priorityClass}">${rec.priority}</span>
+                            <strong>${rec.title}</strong>
+                            <span class="badge">${rec.recommendation_type}</span>
+                        </div>
+                        <div class="validation-message">
+                            <strong>Workload:</strong> ${rec.workload_name} (${rec.namespace})
+                        </div>
+                        <div class="validation-recommendation">
+                            <strong>Description:</strong> ${rec.description}
+                        </div>
+                        <div class="validation-details">
+                            <div class="detail-item">
+                                <strong>Confidence:</strong> ${confidenceLevel}
+                            </div>
+                            <div class="detail-item">
+                                <strong>Impact:</strong> ${rec.estimated_impact || 'N/A'}
+                            </div>
+                        </div>
+                `;
+                
+                if (rec.implementation_steps && rec.implementation_steps.length > 0) {
+                    html += `
+                        <div class="implementation-steps">
+                            <strong>Implementation Steps:</strong>
+                            <ol>
+                                ${rec.implementation_steps.map(step => `<li>${step}</li>`).join('')}
+                            </ol>
+                        </div>
+                    `;
+                }
+                
+                if (rec.kubectl_commands && rec.kubectl_commands.length > 0) {
+                    html += `
+                        <div class="kubectl-commands">
+                            <strong>Kubectl Commands:</strong>
+                            <pre><code>${rec.kubectl_commands.join('\n')}</code></pre>
+                        </div>
+                    `;
+                }
+                
+                if (rec.vpa_yaml) {
+                    html += `
+                        <div class="vpa-yaml">
+                            <strong>VPA Configuration:</strong>
+                            <pre><code>${rec.vpa_yaml}</code></pre>
+                        </div>
+                    `;
+                }
+                
+                html += '</div>';
+            });
+            
+            container.innerHTML = html;
+        }
+
+        // Workload Categories Functions
+        async function loadWorkloadCategories() {
+            showLoading();
+            
+            try {
+                const category = document.getElementById('categoryFilter').value;
+                
+                const params = new URLSearchParams();
+                if (category) params.append('category', category);
+                
+                const response = await fetch(`/api/v1/workload-categories?${params}`);
+                if (!response.ok) {
+                    throw new Error(`HTTP ${response.status}: ${response.statusText}`);
+                }
+                
+                const data = await response.json();
+                displayWorkloadCategories(data);
+                document.getElementById('workloadCategoriesCard').style.display = 'block';
+                
+            } catch (error) {
+                showError('Error loading workload categories: ' + error.message);
+            } finally {
+                hideLoading();
+            }
+        }
+
+        function displayWorkloadCategories(data) {
+            const container = document.getElementById('workloadCategoriesList');
+            
+            if (!data.categories || Object.keys(data.categories).length === 0) {
+                container.innerHTML = '<p>No workload categories found.</p>';
+                return;
+            }
+            
+            let html = `
+                <div class="stats-grid">
+                    <div class="stat-card">
+                        <div class="stat-number">${data.total_workloads}</div>
+                        <div class="stat-label">Total Workloads</div>
+                    </div>
+                </div>
+            `;
+            
+            Object.keys(data.categories).forEach(categoryType => {
+                const category = data.categories[categoryType];
+                const categoryClass = categoryType === 'outlier' ? 'error' : 
+                                    categoryType === 'new' ? 'warning' : 
+                                    categoryType === 'compliant' ? 'success' : 'info';
+                
+                html += `
+                    <div class="accordion">
+                        <div class="accordion-header" onclick="toggleAccordion(this)">
+                            <div class="accordion-title">
+                                <span class="badge ${categoryClass}">${categoryType}</span>
+                                ${category.count} workloads
+                            </div>
+                            <div class="accordion-stats">
+                                <div class="accordion-stat">Avg Priority: ${category.average_priority_score?.toFixed(1) || 'N/A'}</div>
+                                <div class="accordion-stat">VPA Candidates: ${category.workloads.filter(w => w.vpa_candidate).length}</div>
+                            </div>
+                            <div class="accordion-arrow">▶</div>
+                        </div>
+                        <div class="accordion-content">
+                            <div class="workload-list">
+                `;
+                
+                category.workloads.forEach(workload => {
+                    const impactClass = workload.estimated_impact === 'critical' ? 'critical' :
+                                      workload.estimated_impact === 'high' ? 'error' :
+                                      workload.estimated_impact === 'medium' ? 'warning' : 'info';
+                    
+                    html += `
+                        <div class="workload-item">
+                            <div class="workload-header">
+                                <div class="workload-name">${workload.name}</div>
+                                <div class="workload-namespace">${workload.namespace}</div>
+                            </div>
+                            <div class="workload-details">
+                                <div class="workload-stat">
+                                    <strong>Priority Score:</strong> ${workload.priority_score}/10
+                                </div>
+                                <div class="workload-stat">
+                                    <strong>Impact:</strong> 
+                                    <span class="badge ${impactClass}">${workload.estimated_impact}</span>
+                                </div>
+                                <div class="workload-stat">
+                                    <strong>VPA Candidate:</strong> 
+                                    ${workload.vpa_candidate ? '✅ Yes' : '❌ No'}
+                                </div>
+                            </div>
+                        </div>
+                    `;
+                });
+                
+                html += `
+                            </div>
+                        </div>
+                    </div>
+                `;
+            });
+            
+            container.innerHTML = html;
+        }
+
+        // Navigation Functions
+        function showSection(sectionName) {
+            // Hide all sections
+            document.querySelectorAll('.card').forEach(card => {
+                card.style.display = 'none';
+            });
+            
+            // Remove active class from all nav items
+            document.querySelectorAll('.nav-item').forEach(item => {
+                item.classList.remove('active');
+            });
+            
+            // Show selected section
+            const sectionMap = {
+                'dashboard': 'validationsCard',
+                'historical-analysis': 'historicalCard',
+                'smart-recommendations': 'smartRecommendationsCard',
+                'workload-categories': 'workloadCategoriesCard',
+                'vpa-recommendations': 'vpaCard'
+            };
+            
+            const cardId = sectionMap[sectionName];
+            if (cardId) {
+                document.getElementById(cardId).style.display = 'block';
+            }
+            
+            // Add active class to clicked nav item
+            document.querySelector(`[data-section="${sectionName}"]`).classList.add('active');
+            
+            // Load data for the section
+            switch(sectionName) {
+                case 'dashboard':
+                    loadValidationsByNamespace();
+                    break;
+                case 'historical-analysis':
+                    loadHistoricalValidations();
+                    break;
+                case 'smart-recommendations':
+                    loadSmartRecommendations();
+                    break;
+                case 'workload-categories':
+                    loadWorkloadCategories();
+                    break;
+                case 'vpa-recommendations':
+                    loadVPARecommendations();
+                    break;
+            }
+        }
+
+        // Add click handlers for navigation
+        document.addEventListener('DOMContentLoaded', function() {
+            document.querySelectorAll('.nav-item').forEach(item => {
+                item.addEventListener('click', function(e) {
+                    e.preventDefault();
+                    const section = this.getAttribute('data-section');
+                    showSection(section);
+                });
+            });
+        });
    </script>
        </div> <!-- Close main-content -->
    </div> <!-- Close container -->