Encerrado

Trabalhos universitários simples em R

Knn para classificação de Breast Cancer Patients

Você vai agora aplicar do modelo Knn dataframe biopsy (MASS). Após executar o comando library(MASS) você pode executar o coamndo help(biopsy) para conhecer mais sobre esse conjunto de dados. Ele traz dados sobre biopsias e classifica seus resultados como benignos e malignos.

Você vai aplicar o modelo Knn após explorar o dataframe biopsy. Você deve inspecionar se existem atributos que não podem ser aplicados, se existe necessidade de normalização ou transformação dos dados, tratar dados faltantes se houverem e experimentar diferentes valores de k calculando a acuracidade obtida sobre um conjunto de testes. Ao final você escolherá um melhor modelo.

Empregaremos 1/3 de dados de teste e, neste exercício você de fazer a média de 100 diferentes execuções para obter a acuracidade.

POSTANDO O CÓDIGO

1. O código empregado deve ser postado em formato .PDF (a tarefa não permite postar extensões de arquivos diferentes).

2. O código precisa ser executável. O conteúdo pode ser copiado do .pdf aplicado para execução diretamente no RStudio sem a necessidade de quaisquer arquivos ou imports.

3. Em alguns casos o código não precisa trazer todas as respostas. Por exemplo, se vamos executar para k=2, 5 e 12, o código pode estar referenciando apenas o k=12 e sendo substituído seu valor para as demais execuções.

DICAS

1. Para obter a média de 100 diferentes execuções empregue o comando for (1 in 1:100) e não fixe o seed!

2. Comandos que você pode achar útil neste exercício [login to view URL](), summary(), attach()

3. Para obter os elementos de teste empregue: L <- sample(1:nrow(df),round(nrow(df)/3))

*Empregue o RStudio com o library(class) e library(MASS)

Habilidades: Linguagem de Programação R

Sobre o Cliente:
( 0 comentários ) Santana de Parnaiba, Brazil

ID do Projeto: #28172321