Bem-vindo ao Big Data XYZ! Este repositório contém tudo o que você precisa para configurar, desenvolver e implementar um ambiente de Big Data XYZ.
- Big Data XYZ
Para utilizar este projeto, você precisará dos seguintes componentes:
- Sistema Operacional compatível com Docker
- Windows
- Windows 10/11
- WSL2
- Windows Terminal
- Linux
- Ubuntu ou similar
- Windows
- Git
- Docker
- k3d/k3s
- Kubectl
- VSCode
Antes de iniciar a instalação, certifique-se de ter os seguintes pré-requisitos instalados:
- Instalação do WSL2 (Somente Windows)
- Instalação do Windows Terminal (Somente Windows)
- Instalação do Git
-
Clone o repositório:
git clone https://github.com/murilorodelli/dataops.git cd dataops
-
Configure o ambiente:
./scripts/bootstrap.sh
-
Encerre a sessão:
Saia do seu terminal e sessão atuais e faça login novamente:
-
Para WSL (Subsistema Windows para Linux):
- Feche a janela do terminal atual.
- Abra uma nova janela do terminal.
-
Para Ubuntu nativo:
- Saia da sua sessão atual:
- Clique no menu do sistema (canto superior direito) e selecione 'Sair'.
- Faça login novamente com suas credenciais de usuário.
- Saia da sua sessão atual:
-
-
Instale aplicativos essenciais:
./scripts/setup/brew-pkgs.sh
k3d/k3s é uma ferramenta que facilita a execução de Kubernetes localmente.
-
Inicie o k3d/k3s:
k3d/k3s start
-
Verifique a instalação:
kubectl get nodes
Kubectl é uma ferramenta de linha de comando para gerenciar clusters Kubernetes.
-
Verifique a instalação do kubectl:
kubectl version --client
Para uma melhor experiência de desenvolvimento com Kubernetes, instale as seguintes extensões no VSCode:
Para debugar suas aplicações dentro do Kubernetes, siga os passos:
- Configure o
launch.json
no VSCode para sua aplicação Python. - Utilize a extensão do Kubernetes para depurar diretamente no cluster.
-
Inicialize um repositório Git:
git init
-
Adicione o repositório remoto:
git remote add origin https://github.com/seu-usuario/projeto-big-data.git
-
Configure o arquivo
.gitignore
para ignorar arquivos desnecessários.
- Crie um arquivo
Jenkinsfile
ou configure o GitHub Actions para o pipeline CI/CD. - Defina os estágios de build, teste e deploy.
projeto-big-data/
├── data/
├── docs/
├── scripts/
│ ├── setup.sh
│ ├── start-hadoop.sh
│ ├── start-spark.sh
├── src/
│ ├── hadoop/
│ ├── spark/
│ ├── k8s/
├── tests/
├── .vscode/
│ ├── launch.json
│ ├── settings.json
├── .github/
│ ├── workflows/
│ ├── ci.yml
├── .env.example
├── README.md
├── requirements.txt
└── .gitignore
-
Iniciar Kubernetes:
k3d/k3s start
-
Verificar status do cluster:
kubectl get nodes
-
Executar testes:
pytest
Contribuições são bem-vindas! Por favor, veja o arquivo CONTRIBUTING.md para mais detalhes.
Este projeto está licenciado sob a Licença MIT. Veja o arquivo LICENSE para mais detalhes.