Posts Tagged ‘bases de datos’

Retornando arrays con PlPython

Posted on the Abril 9th, 2009 under GNU/Linux,Probando herramientas,Software Libre by nacho

PlPython es un lenguaje procedural (PL) que permite utilizar Python en una base de datos PostreSQL para poder escribir los procedimientos almacenados. En realidad actualmente es un lenguaje no confiado (untrusted). Se puede leer más aquí: PlPythonu.

Si bien Python maneja listas, diccionarios y otras estructuras de datos con bastante simpleza, no encontramos una manera de hacer casting a un array o vector de PostgreSQL. Particularmente, en el ejemplo debajo, se puede ver que implementamos un wrapper para poder utilizar el motor de expresiones regulares de Python, dentro de la DB, ya que tiene algunas cuestiones más avanzadas que el que trae PgSQL por defecto.

Lo que hicimos fue crear una cadena, con la representación serializada de un Array y dejar que haga el casting PgSQL. Les dejo el código para que lo adapten a sus necesidades. En este caso devuelve un vector de TEXT (TEXT[]) con la idea de emular el resultado devuelto por regexp_matches() en plsql. la signatura de la función es esta:

regexp_python(text,text)  RETURNS text[]
-- Function: regexp_python(text, text)
 
-- DROP FUNCTION regexp_python(text, text);
 
CREATE OR REPLACE FUNCTION regexp_python(p_str text, p_ereg text)
  RETURNS TEXT[] AS
$BODY$import re
import string
m = re.search(p_ereg, p_str,re.I)
IF m IS None:
    RETURN None
ELSE:
    RETURN ('{"'+'","'.join([re.escape(x) FOR x IN m.groups('NULL')])+'"}').REPLACE('"NULL"','NULL')$BODY$
  LANGUAGE 'plpythonu' VOLATILE
  COST 100;
ALTER FUNCTION regexp_python(text, text) OWNER TO postgres;

Los arrays en PgSQL son serializados como una colección de datos entre llaves:
{‘text1′,’text2′}.

Gracias Milton y Daiana por investigar y aplicar todas estas cosas conmigo ;-)

Postgresql y update muy lentos (cuando hay alta carga)

Posted on the Febrero 10th, 2009 under Probando herramientas by nacho

Este es un mini post, para tenerlo a mano y que alguno que busque lo encuentre. Postgresql en los escenarios que la he probado, ha resultado más lenta que MySQL usando MyISAM e InnoDB. Por supuesto esto con la configuración que trae de base en una instalación Debian, Ubuntu o con el instalador (con perfiles) en Windows. O modificándole muy pocos parámetros.

Hace un tiempo ya que para un trabajo que estamos haciendo buscábamos la forma de acelerar los updates en Postgres. No es que fuera algo intolerable, pero a veces necesitabamos correr varias consultas que actualizaban unos 2M registros en base a si cumplían o no unas 40 expresiones regulares bastante complejas.

Bueno, me dirán, por qué no usaste MySQL entonces. Bueno, porque no je. En realidad porque en cuanto a extensibilidad usando los lenguajes en Postgres (plpythonu, plpgsql,plphp y quizá pljava) teníamos más flexibilidad. Tenía mejores capacidades de gestión de expresiones regulares y posibilidad de usar tipos de datos vectores (para los matching de las reg. exp.).

El post corto se está alargando y me voy a explayar en otros. Lo que intentamos fue meter commits entre medio de los updates, pero de nada servía. Incluso encerrar en una transacción varios updates. Tampoco.

Leyendo encontré que tiene que ver en la performance de PgSQL las copias que se genera de cada tabla que se está accediendo para mantener consistencia en cuanto a las consultas d ediferentes usuarios. Los checkpoints que va haciendo en el log (log de transacciones, no el log de errores) del sistema son los que estaban afectando. En definitiva aumentando el tamaño de los segmentos de los checkpoints debería haber una mejora en performance.

Este parámetro se cambia en

/etc/postgresql/8.3/main/postgresql.conf

checkpoint_segments = 256

Si hubiese mirado el log (avisos y errores) de PgSQL quizá me hubiese dado cuenta. Se la pasaba imprimiendo:

2009-02-10 11:23:09 ARST LOG: los checkpoints están ocurriendo con demasiada frecuencia (cada 2 segundos)
2009-02-10 11:23:09 ARST HINT: Considere incrementar el parámetro de configuración «checkpoint_segments».

Prometo en otro post contar los resultados y ordenar esto.

Fuentes:
http://pugs.postgresql.org/node/499
http://www.linux-es.org/node/660
Por qué: http://www.network-theory.co.uk/docs/postgresql/vol1/Increasecheckpoint_segments.html
http://archives.postgresql.org/pgsql-performance/2008-06/msg00119.php

çíàêîìñòâà íà êàâìèíâîäàõ
ïîðíî ñàéò çâåçä øîó áèçíåññà
Îíëàéí êóïèòü â åêàòåðèíáóðãå Ëåâèòðà
ìåíþ äëÿ äèåòû ïî 3 ãðóïïå êðîâè
êóïèòü äæåíåðèê ñèàëèñ ñîôò
äèåòà þ.íà÷àëîâîé
çíàêîìñòâà àáõàçèÿ
ñëóæáà çíàêîìñòâ íèæíèé íîâãîðîä
Íèçêàÿ öåíà êóïèòü â ìîñêâå Çèáàí
î÷êîâàÿ äèåòà
ðåçóëüòàòû ïîõóäåíèÿ è îçäîðîâëåíèÿ ñ ïîìîùüþ ãåðáàëàéô
ìàäè 24 çíàêîìñòâà
Íå äîðîãî êóïèòü â ñàìàðå Ñèàëèñ Ñîôò
ñâèíãåð çíàêîìñòâà â êðàñíîÿðñêå
äèåòà 2 ãðóïïå êðîâè
ðåöåïòû áåññîëåâîé äèåòû
äèåòà àëñó êîôå è øîêîëàä
ôîðóì îâîùíàÿ äèåòà
ftp ñêà÷àòü ïîðíî äëÿ ñìàòôîíà
ðîñòîâ ïîðíî
çíàêîìñòâà òîðîíòî
äèåòà î÷èñòêà êèøå÷íèêà
ïåðåäà÷à ïåðâîãî êàíàëà ìàëàõîâ ïëþñ ïåðåäà÷à âîçìîæíîñòÿõ ïîõóäåíèè
àñüêàçíàêîìñòâà
ïîðíî ñ ÷å÷åíêàìè
çíàêîìñòâà äèòåé 10-14 ëåò
êðåìëåâñêàÿ äèåòà ïî äíÿì
ëå÷åíèå èìïîòåíöèè ñèàëèñ ëåâèòðà âèàãðà ñðàâíèòåëüíûå öåíû
åêàòåðèíáóðã ñèàëèñ
ïîðíîãðàôè÷åñêîå âèäåî ëåñáèÿíîê
ÿòðûøíèê ïîòåíöèÿ
ïðîñòàòèëåí äåéñòâèå
çíàêîìñòâî â êðàñíûõ áàêàõ
ñåêñ çíàêîìñòâà â íèæíåâàðòîâñêå
êëèîí ä ñòîèìîñòü
ïîðíî ðîëèê äîñòóïíûå
ðåöåïò íàñòîéêè äëÿ ïîõóäåíèÿ ëèñòâåííûé ãðèá òðóòîâèê
ïðåâüþ ôîðóì ïîðíî ññûëêè
ðàñêàçû äåòñêîãî ïîðíî
ïîðíî xxx çàãðóçèòü
êàâêàçñêèå ñàéòû çíàêîìñòâ
êðåìëåâñêàÿ äèåòà ôîðóì åâãåíèé ÷åðíûõ
ïîçíàêîìëþñü ñî ñòåðâîé
öèí öèí ïîõóäåíèå
ïîðíî ñààêàøâèëè ñêà÷àòü
âûñîêîïàðíûå ôðàçû äëÿ çíàêîìñòâà
ãåé çíàêîìñòâà íåãðû
êaê ïîõóäåòü ía 10 êã ça 8 äíåé
ðàäìèëà àíêåòà çíàêîìñòâà
çäîðîâüå ïî÷êè äèåòà
Ñðî÷íî êóïèòü â Íîâîñèáèðñêå Ñèàëèñ
çíàêîìñòâî c àíãëè÷àíèíîì
Äåøåâî ñòîèìîñòü âèàãðà 50 ìã
ãîä çíàêîìñòâà îòâåòèòü
Àíîíèìíî êóïèòü â ïèòåðå ïîâûøåíèå ïîòåíöèè
ñàìûå ëóäøèå äèåòû
Online ïðèîáðåñòè âèàãðà òàáëåòêè
àðáóçíàÿ äèåòà ôîðóì
Àïòåêà êóïèòü â îìñêå ñðåäñòâî ïîâûøåíèÿ ïîòåíöèè
âîëãîôàðì ñèàëèñ ñîôò
ãåé ïîðíî êëèïû ñêà÷àòü
êàáà÷êîâàÿ äèåòà
êàëîðèè äèåòà ñêà÷àòü êîìïüþòåðíûå ïðîãðàììû
ýôôåêòèâíîñòü áàíàíîâîé äèåòû
òåðæèíàí íà ðàííèõ ñðîêàõ áåðåìåííîñòè
Online êóïèò â ðîññèè ïîâûøåíèå ïîòåíöèè
çíàêîìñòâà 8 903
äåâ÷îíêè ðîñòîâà ïîçíàêîìèòüñÿ
êóðèíûé áóëüîí ïîõóäåíèå
ãäå ïîçíàêîìèòüñÿ â ìîñêâå
àëêîãîëü è ñåàëåêñ
êàê ïîçíàêîìèëèñü àëôåðîâà è àáäóëîâ
 êàêîé àïòåêå êóïèòü â Íîâîñèáèðñêå èíäèéñêàÿ âèàãðà
ïîðíî ÷àñòíîå çíàìåíèòîñòåé
ýêñòðåííûå ìåòîäû ïîõóäåíèÿ
çíàêîìñòâà òðàíñû äîíåöê
Ñðî÷íî ñòîèìîñòü Ñèàëèñ Ñîôò
 êàêîé àïòåêå êóïèòü â ñàíêò ïåòåðáóðãå Âèàãðà
êðàñèâûå ïîðíî äåâóøêè êèåâ
çíàêîìñòâà ðèììèíã
ñêà÷àòü êíèãó äèåòà íà êàïóñòíîì ñóïå
ëåñòàò ôîòî
ïîðíî ñ òîëñòûìè îò 40 äî 50 ëåò
áûñòðî ïîõóäåòü ïîñëå ðîäîâ
Áåç ðåöåïòà êóïèòü äåøåâóþ âèàãðà òàáëåòêè
áûñòðûå íå èçíóðèòåëüíûå äèåòû
çíàêîìñòâà ã.âîëîãäà
âèàãðà àïòåêà êðàñíîÿðñê
Îíëàéí êóïëþ âèàãðó ñèàëèñ ëåâèòðó
êîäèðîâàíèå ïðè ïîõóäåíèè
ïîìî8ãàåò ëè áîäèìèðèí ðåàëüíî ïîõóäåòü
ïîðíî âèäåîêëèïû ñêà÷àòü
àâñòðàëèÿ ðóñêîÿçû÷íûé ñàéò çíàêîìñòâà
äåéñòâîâàòü äæåíåðèê ñèàëèñ ñîôò
äèåòà õîðîøèõ íîâîñòåé
ýôôåêòèâíî ïîõóäåòü çà ìàêñèìàëüíî êîðîòêèé ñðîê
äèåòà 90
ñêà÷àòü ñóïåð äèåòó
çíàêîìñòâà ñ áèñåêñóàëàìè
çíàêîìñòâà â ã.êñòîâî