Automágica: durante 2017 estoy trabajando bastante en Automágica, mi software para editar libros: Más información - Posts relacionados

Fermat vs. Pythagoras mejorado

Logré bajar la complejidad de mi solución de un orden cúbico a un orden cuadrático, la diferencia en cuanto a tiempo de ejecución requerido es sorprendente:

comparacion de 3 soluciones

Pero todavía no e suficiente, con un N igual a 10000 la respuesta se obtiene luego de 10 minutos (en mi computadora de 700 Mhz).

En esta solución ya no uso la función pythagoras(x,y,z). Solo hay 2 ciclos for anidados y el valor de z se calcula como z = sqrt( pow(x,2) + pow(y,2) ). Si z es entero, se tiene un triplete válido y solo falta verificar si x,y,z son primos relativos.

def is_int(i):
return i == int(i)

def solv106f(N):

miembros = []

tripletes_rprim = 0

for x in range(1,N-1):

    for y in range(x+1,N):

        z = sqrt( pow(x,2) + pow(y,2) )

        if (is_int(z) and z <= N):

            for a in [x,y,z]:

                if a not in miembros:

                    miembros.append(a)

            if (rprim(x,y,z)):

                tripletes_rprim +=1



no_miembros = N - len(miembros)

return N, tripletes_rprim, no_miembros


Fermat vs. Pythagoras

Esta es mi solución al problema número 6 de una larga lista de problemas de programación. A pesar de que, como estudiante de Ingeniería, pasé los últimos 3 años y medio estudiando distintas formas de las matemáticas, no conocí el Último Teorema de Fermat hasta que mi amigo Joel, estudiante de Filosofía, me lo comentó.

El problema en realidad no tiene mucho que ver con Fermat, pero sí con Pitágoras: dado un valor N, hay que encontrar cuántos tripletes x,y,z satisfacen x² + y² = z² tales que

    <li>x,y,z sean menores o iguales a N</li>
    
    <li>x,y,z sean primos relativos (es decir que 1 es su único divisor común)</li>
    
    <li>x &lt; y &lt; z</li>
    

    Además hay que encontrar cuántos números mayores que 0 y menores o iguales a N no pertenecen a ninguno de los tripletes (no solo a los tripletes de primos relativos).

    El enunciado original aquí.

    Una posibilidad sería explorar exasutivamente todas las combinaciones de números x,y,z menores o iguales a N, y para cada uno verificar si cumplen las características pedidas. Pero esto sería de altísima complejidad, sería de orden cúbico. Hay que pensar una mejor solución.

    Empecemos con una función que dado 3 valores x,y,z me diga si satisfacen el Teorema de Pitágoras:

    from math import pow
    
    
    
    def pythagoras(x,y,z):
    
        return (pow(x,2)+pow(y,2) == pow(z,2))
    
    
    
    >>> pythagoras(3,4,5)
    
    True
    
    >>> pythagoras(1,1,1)
    
    False
    
    >>> pythagoras()
    
    True
    
    

    También necesito una función, que dado 3 valores x,y,z me diga sin son primos relativos entre sí:

    def mcd(a,b): # algoritmo de euclides
    
        if (a == b): return a
    
        elif (a < b): a,b = b,a # a es el más grande
    
        while(b != 0):
    
            r = a % b
    
            a = b
    
            b = r
    
            return a
    
    
    
    def rprim(x,y,z):
    
        return (mcd(mcd(x,y),z) == 1)
    
    

    La solución que explora todas las combinaciones de 3 números constaría de 3 ciclos for anidados y en el curerpo del más profundo se haría las preguntas pertitenes a la resolución del problema: ¿ese triplete satisface el teorema de pitagoras? ¿son primos relativos? ¿x<y<z?

    for(x=1;x=<N;x++)
    
        for(y=1;y=<N;y++)
    
            for(z=1;z=<N;z++)
    
                # ¿...?
    
    

    Una de las condiciones es que x<y<z, esto permite una redefinición tal que NO se exploren todas las combinaciones de 3 números menores que N sino solo las combinaciones que cumplen con esta restricción:

    for(x=1;x=<N-2;x++)
    
        for(y=x+1;y=<N-1;y++)
    
            for(z=y+1;z=<N;z++)
    
                # ¿..?
    
    

    ¿Esta solución es buena o no es mucho mejor a una en la que todos los ciclos for vayan de 1 a N y por cada uno se pregunte si x,y,z?

    En el archivo pythagoras.py están definidas dos funciones: solv106s(N), basada en la primera aproximación y solv106(N) que espera ser mejor.

    Este programita sirve para medir el tiempo de las dos ejecuciones y compararlos.

    import timing
    
    
    
    def test(N=1000):
    
        timing.start()
    
        solv106s(N)
    
        timing.finish()
    
        print "la primer solución tardo " + str(timing.seconds()) + " segundos"
    
        timing.start()
    
        solv106(N)
    
        timing.finish()
    
        print "la segunda solución tardo " + str(timing.seconds()) + " segundos"
    
    

    Hago una prueba con un valor relativamente grande, N=1000 el valor por defecto:

    >>> test()
    
    la primer solución tardo  1879 segundos
    
    la segunda solución tardo 1561 segundos
    
    

    31 minutos contra 26 minutos.. no me parece una diferencia muy grande. Nota: mi máquina es un AMD K6 II de 700 Mhz.

    Esta gráfica compara las dos soluciones luego de haberlas probado con diferentes valores de N, obtenido unos puntos e interpolar una curva representativa:

    comparacion

    mmm, hay que pensar una mejor solución.


    3n+1

    ACM (Association for Computing Machinery) organiza unas competencias de programación llamadas ICPC (International Collegiate Programming Contest). En esta dirección hay muchos problemas de las competencias: http://acm.uva.es/problemset/.

    Este es el enunciado del primer problema de la guía: http://acm.uva.es/p/v1/100.html

    El fin de semana hice esta solución:

    (nota: los lenguajes soportados por las competencias son C y Java, mi solución está escrita en Python por que me resulta más ágil. De todas formas importa más el algoritmo que el lenguaje.)

    def odd(n):
    
        return not (n%2 == 0)
    
    
    def tnu(n=1):
    
        print n
    
        if (n == 1): return
    
        elif (odd(n)): n = 3*n+1
    
        else: n = n/2
    
        tnu(n) # la recursividad por la cola es evitable
    
    
    >>> tnu(22)
    
    22
    
    11
    
    34
    
    17
    
    52
    
    26
    
    13
    
    40
    
    20
    
    10
    
    5
    
    16
    
    8
    
    4
    
    2
    
    1
    
    

    La longitud del ciclo para un n dado es la cantidad de valores que la función tnu() develve (incluido el 1 final)

    El problema pide leer un archivo con pares i,j y para cada par devolver la mayor longitud de ciclo para todos los enteres enter i y j incluyendo a i y a j.

    Solución Exaustiva

    Una solución exaustiva podría consistir en calcular para cada par i,j todos las longitudes de ciclo asociadas y devolver la mayor.

    Redefino tnu para que en lugar de imprimir los sucesivos valores de n devulva una lista con los valores, el segundo argumento de la función es una lista vacía.

    def tnu(n,l):
    
        #print n
    
        l.append(n)
    
        if (n == 1): return l
    
        elif (odd(n)): n = 3*n+1
    
        else: n = n/2
    
        return tnu(n,l) # la recursividad por la cola es evitable
    
    

    Suponiendo que ya se leyeron los pares del archivo correspondiente y se tienen en una lista llamada pairs:

    def solv1(pairs):
    
        for i,j in pairs:
    
            maxc = 0
    
            for n in range(i,j+1):
    
                maxc = max(len(tnu(n,[])),maxc)
    
            print i, j, maxc
    
    
    >>> pairs = [(1,10),(88,123),(7,1),(55,455),(10000,10003)]
    
    >>> solv1(pairs)
    
    1 10 20
    
    88 123 119
    
    7 1 0
    
    55 455 144
    
    10000 10003 180
    
    >>> pairs = [(1,10),(100,200),(201,210),(900,1000)]
    
    >>> solv1(pairs)
    
    1 10 20
    
    100 200 125
    
    201 210 89
    
    900 1000 174
    
    

    Bien, esta solución ANDA, pero no es óptima. De hecho probablemente sea la solución menos eficiente :-) la de la fuerza bruta.

    Solución Dinámica

    La idea es almacenar los resultados ya calculados para no tener que hacerlos una y otra vez. Si se pide la máxima longitud de ciclo (mlc) enter 100 y 200 y obtengo 125 y luego se pide la máxima longitud de ciclo enter 1 y 300, voy a calcular la mlc para el par 1,100, luego lo haré para 200,300 y luego compararé los resultados con 125 quedándome con el mayor de los 3.

    Pero.. que pasa si ya he calculado la mlc para los valores entre 2 y 99?

    def solv1din(pairs,dic):
    
        for i,j in pairs:
    
            maxc = f_maxc(i,j,dic)
    
            print i, j, maxc
    
            dic[i,j]=maxc
    
    
    def f_maxc(i,j,dic):
    
        wide = 0
    
        for a,b in dic.keys():
    
            if a == i and b == j: return dic[a,b]
    
            if (i<=a and b<=j and b-a > wide):
    
                f,g = a,b
    
                wide = b-a
    
        if (wide == 0): #ningún rango del diccionario estaba dentro de i,j
    
            maxc = 0
    
            for n in range(i,j+1):
    
                maxc = max(len(tnu(n,[])),maxc)
    
            return maxc
    
        else:
    
            return max(f_maxc(i,f,dic),dic[f,g],f_maxc(g,j,dic))
    
    
    >>> solv1din(pairs,{})
    
    1 10 20
    
    100 200 125
    
    201 210 89
    
    900 1000 174
    
    

    Una versión no recursiva de tnu podría ser algo como esto:

    def tnu(n):
    
        l = []
    
        while(n != 1):
    
            l.append(n)
    
            if (odd(n)): n = 3*n+1
    
            else: n = n/2
    
        l.append(1)
    
        return l
    
    

    Download

    • Una implementación completa que resuelve el problema: 3n+1.py
    • Un archivo de entrada de ejemplo: input100.txt

    Ejemplo de uso

    juanjo@sarge:~/problemas$ ./3n+1.py input100.txt
    
    1 10 20
    
    100 200 125
    
    201 210 89
    
    900 1000 174
    
    88 123 119
    
    7 1 0
    
    55 455 144
    
    10000 10003 180
    
    


    encontre mi carpeta de Algoritmos! :-D

    Luego de estar desaparecida por más de dos años (Diciembre 2003), ayer apareció. Empecé a acomodar mi pieza (lang: dormitorio, habitación) --todavía no terminé-- y entre otras cosas (polvo, casettes, disquettes, revistas, libros, comida, una talent msx) desaparecidas encontré mi ya dada por perdida carpeta de Algoritmos y Estrucuturas de Datos:

    Conversación entre A y B:

    A: ¿Qué edad tienen tus tres hijos?

    B: El producto de sus edades es 36 y la suma es igual al número de ventanas de la casa que vemos enfrente.

    A: Necesito preguntarte algo más, ¿qué color de ojos tiene tu hijo mayor?

    B: Azules

    A: Entonces ya se las edades de tus 3 hijos.

    El enunciado fué dado por el Profesor Marina durante los primeros días de cursado, pero no se la respuesta :-( ¿Alguien la sabe? ¿alguien puede adivinar las edades? En un margen tengo anotado: RTA: 9,2,2 ... pero no se por qué.. :-)