Big Data: Mineria de datos

Enviado por keopx el Dom, 18/08/2013 - 18:19

Jornada de Big Data en Enpresa Digitala enfocada en la minería de datos para su posterior explotación.

Indice:

  • Introducción.
  • KDD: Proceso de Extracción de conocimiento.
  • Procesos de un proyecto de minería de datos.
  • Técnicas de minería de datos.
  • Ciclo de un Proyecto de Minería de Datos.

 

Big Data: Herramientas de reporte

Enviado por keopx el Mar, 18/06/2013 - 18:41

Jornada de Big Data en Enpresa Digitala enfocada en las herramientas para reportes y poder explotar los datos almacenados.

Qué son los reportes:

  • Punto final a BigData.
  • La Capa de presentación
    • Reportes Multiplataforma.
    • Múltiples fuentes.
    • Parametrizables.
    • Planificados.
    • Distribuibles.
    • Reportes enlazados.

 

Añadir usuario a grupo existente Linux

Enviado por keopx el Vie, 16/11/2012 - 17:35

Añadir usuario a grupo existente Linux:

$ sudo usermod -a -G vboxusers bob

Si deseas cambiar el grupo principal del usuario de forma predeterminada (pongamos que se llama grupo adm) no hay problema:

$ sudo usermod -g adm bob

Limpiar memoria cache en Linux sin reiniciar

Enviado por keopx el Sáb, 10/11/2012 - 20:38

Cuando un sistema lleva mucho tiempo iniciado y este genera mucha carga suele estar bien limpiar la memoria cache para que no comience a "swapear".

El comando en si es sencillo y no excesivamente intrusivo. Al comienzo ira un poco más lento pero a la larga se agradecerá.

Es necesario ser root

# sync; echo 3 > /proc/sys/vm/drop_caches

Podemos crear un script para que lo realice automaticamente:

Driver no oficial de realtek RTL8273AE-BT para Toshiba Satellite C855 en Debian y Ubuntu

Enviado por keopx el Dom, 02/09/2012 - 19:50

Como compilar e instalar los driver para Ubuntu

Abrimos una terminal con Ctrl+Alt+T.

Necesitaras descargarte estos paquetes para poder compilar los drivers:

$ sudo apt-get install build-essential linux-headers-generic linux-headers-`uname -r`

Pega este linea en la consola para descargar y extraer el driver en un solo paso:

Instalacion de paquetes latex con modercv en Debian Wheezy

Enviado por keopx el Mié, 15/08/2012 - 17:55

Lo primero que hay que hacer es bajarse los paquetes.

Requiere bastante espacio, pero siempre quedara eliminarlos después de usar.

Instalación:

sudo apt-get install texlive-latex-extra texlive-fonts-recommended lmodern texlive

Y se instalaran los siguientes paquetes, que la verdad son muchos, por eso recomiendo una vez utilizados eliminarlos:

Simplifica los accesos remotos con ~/.ssh/config

Enviado por keopx el Sáb, 23/06/2012 - 09:59

Para poder acceder a equipos remotos de forma ágil y sencilla podemos utilizar el fichero ~/.ssh/config que nos permite definir equipos, puertos, usuarios, rsa,... que nos facilitara la vida.

Queremos una clave diferente para acceder a github.com su propia clave.

Editamos:

nano ~/.ssh/config

Podemos seguir el siguiente ejemplo:

Host github.com
  User git
  Hostname github.com
  PreferredAuthentications publickey
  IdentityFile ~/.ssh/git_rsa

O acceder por ssh a un server donde hemos configurado el puerto de ssh en el 7020:

Escaner Brother DCP-7025 en Debian Wheezy amd64 y ubuntu 11.10

Enviado por keopx el Vie, 24/02/2012 - 20:16

Parece ser que los driver de Brother no están del todo correcto por eso es necesario realizar algunas modificaciones para su correcto funcionamiento:

$ wget http://www.brother.com/pub/bsc/linux/dlf/brscan-skey-0.2.1-3.amd64.deb
$ wget http://www.brother.com/pub/bsc/linux/dlf/brscan2-0.2.5-1.amd64.deb
$ sudo dpkg -i brscan*

Editamos el fichero de udev que cambia algo respecto al de ubuntu, pero aun así editamos y añadimos lo siguiente delante del resto de drivers y despues de LABEL="libsane_usb_rules_begin":

En ubuntu: