NanoMatter Custom RAG App

Overview

The NanoMatter Custom Retrieval-Augmented Generation (RAG) App is designed to enable intelligent query answering by leveraging document-based knowledge. It currently processes PDF files to generate contextually relevant responses. Future iterations aim to support a broader range of file types and include an AI Agent for advanced query handling.

Features

Current Features

PDF Parsing: Extracts information from PDF documents and generates responses using Hugging Face Open Source Model.
Contextual Query Handling: Provides accurate answers based on the contents of uploaded PDFs.

Future Enhancements

Other common document formats
AI Agent Integration:
- Enhanced conversational capabilities.
- Ability to synthesize responses across multiple documents and file types.
Multi-Document Analysis: Simultaneous querying across multiple files.
Search and Summarization: Advanced document search and concise summaries for quick insights.

Technical Details

Backend: Hugging Face Open source for natural language understanding and generation.
Input Format: PDF (current version), CSV, XLSX
Output: Text-based responses tailored to user queries.
Frontend: Stream-lit based UI

Architecture

File Upload Module: Handles PDF uploads and validates file format.
Preprocessing: Extracts text from PDFs using OCR (if necessary) and prepares data for GPT-4.
Query Engine:
- Matches user queries with relevant document content.
- Generates responses using GPT-4.
Response Module: Returns precise and context-aware answers.

Future Architecture Upgrades

File Format Conversion: Incorporate libraries for handling diverse file types.
AI Agent Layer: A conversational AI module capable of cross-referencing data and learning from interactions.

Installation and Setup

Prerequisites

Python 3.8+
Virtual Environment
Required libraries (specified in requirements.txt):
- openai
- PyPDF2
- langchain
- faiss-cpu

Steps

Clone the repository:

git clone https://github.com/nanomatter/RAG-Nanomatter.git

Navigate to the project directory:
```
cd rag-app
```

Create and activate a virtual environment:

python3 -m venv env
source env/bin/activate

Install dependencies:
```
pip install -r requirements.txt
```
Run the application:
```
python app.py
```

Usage

Launch the app and upload a PDF document.
Enter your query in the input field.
Receive a detailed response based on the document content.

Roadmap

Phase 1: Current Version

Implement PDF parsing and query response using GPT-4.

Phase 2: Multi-Format Support

Add compatibility for CSV, TXT, XLSX, DOCX, and other formats.

Phase 3: AI Agent Integration

Develop an intelligent AI Agent for:
- Advanced queries.
- Multi-document handling.
- Continuous learning.

Phase 4: Advanced Features

Implement robust search functionalities.
Develop user-friendly dashboards for document management.

License

This project is licensed under the Apache - 2.0.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
.gitignore		.gitignore
.python-version		.python-version
LICENSE		LICENSE
README.md		README.md
application.py		application.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

NanoMatter Custom RAG App

Overview

Features

Current Features

Future Enhancements

Technical Details

Architecture

Future Architecture Upgrades

Installation and Setup

Prerequisites

Steps

Usage

Roadmap

Phase 1: Current Version

Phase 2: Multi-Format Support

Phase 3: AI Agent Integration

Phase 4: Advanced Features

License

About

Releases

Packages

Languages

License

mandeep-karn/RAG-Nanomatter

Folders and files

Latest commit

History

Repository files navigation

NanoMatter Custom RAG App

Overview

Features

Current Features

Future Enhancements

Technical Details

Architecture

Future Architecture Upgrades

Installation and Setup

Prerequisites

Steps

Usage

Roadmap

Phase 1: Current Version

Phase 2: Multi-Format Support

Phase 3: AI Agent Integration

Phase 4: Advanced Features

License

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages