Open Geo Spy - Architecture Overview

This project is a sophisticated geolocation system that analyzes images and videos to predict their geographical location using multiple data sources and AI models.

Core Features

Image Analysis
- Extracts text, business names, landmarks, and architectural features
- Analyzes environmental features (terrain, vegetation, buildings)
- Processes metadata including EXIF data
- Supports both images and videos
Location Detection
- Multi-source location search (Google, OSM, GeoNames)
- Business and landmark verification
- License plate recognition and region mapping
- Visual similarity search
AI/ML Integration
- Uses OpenAI/OpenRouter for text analysis
- Implements OSV5M model for location prediction
- Visual search capabilities
- Advanced reasoning system for location resolution
Web Interface
- React-based frontend
- File upload support
- Interactive map display
- Result visualization

System Architecture

graph TB
    subgraph Frontend
        UI[React UI]
        FM[File Upload]
        RD[Result Display]
    end

    subgraph API Layer
        API[FastAPI Server]
        CFG[Config]
    end

    subgraph Core Processing
        IA[Image Analysis]
        ML[ML Models]
        GD[Geo Data]
        RS[Reasoning]
    end

    subgraph Image Analysis Components
        IA --> ME[Metadata Extractor]
        IA --> VS[Visual Search]
        IA --> AN[Image Analyzer]
    end

    subgraph Location Services
        GD --> ES[Enhanced Search]
        GD --> GI[Geo Interface]
    end

    subgraph AI Models
        ML --> OSV[OSV5M Predictor]
        ML --> LLM[LLM Integration]
    end

    UI --> FM
    UI --> RD
    FM --> API
    API --> IA
    API --> ML
    API --> GD
    API --> RS
    RS --> LR[Location Resolver]
    
    %% External Services
    VS --> EXT1[Google Images]
    VS --> EXT2[DuckDuckGo]
    GI --> EXT3[OpenStreetMap]
    GI --> EXT4[GeoNames]
    LLM --> EXT5[OpenRouter/OpenAI]

Data Flow

User uploads image/video through the frontend
API receives file and initiates analysis
Image Analysis extracts features:
- Text and entities
- Environmental features
- Metadata
Multiple location searches are performed:
- OSV5M prediction
- Visual similarity search
- Geographic database queries
Location Resolver combines all data points
Final location prediction is returned to frontend

Key Components

ImageAnalyzer: Core component for feature extraction
GeoLocator: Main orchestrator for the location detection process
LocationResolver: Combines multiple data sources for final prediction
VisualSearchEngine: Finds visually similar locations
EnhancedLocationSearch: Advanced location search using multiple sources

Technologies Used

Frontend: React, TypeScript, Leaflet
Backend: Python, FastAPI
AI/ML: OpenAI/OpenRouter API, OSV5M
Databases: OpenStreetMap, GeoNames
External APIs: Google Places, DuckDuckGo

Performance Considerations

Parallel processing for multiple search sources
Caching for API responses
Efficient image processing with chunking
Smart candidate filtering and ranking

Security Features

API key management
Rate limiting
Input validation
Secure file handling

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Open Geo Spy - Architecture Overview

Core Features

System Architecture

Data Flow

Key Components

Technologies Used

Performance Considerations

Security Features

FilesExpand file tree

architecture.md

Latest commit

History

architecture.md

File metadata and controls

Open Geo Spy - Architecture Overview

Core Features

System Architecture

Data Flow

Key Components

Technologies Used

Performance Considerations

Security Features