CA2493407A1 - Procede de replication d'une application logicielle dans une architecture multi-ordinateurs, procede pour realiser une continuite de fonctionnement mettant en oeuvre ce procede de replication, et systeme multi-ordinateurs ainsi equipe - Google Patents

Procede de replication d'une application logicielle dans une architecture multi-ordinateurs, procede pour realiser une continuite de fonctionnement mettant en oeuvre ce procede de replication, et systeme multi-ordinateurs ainsi equipe Download PDF

Info

Publication number
CA2493407A1
CA2493407A1 CA002493407A CA2493407A CA2493407A1 CA 2493407 A1 CA2493407 A1 CA 2493407A1 CA 002493407 A CA002493407 A CA 002493407A CA 2493407 A CA2493407 A CA 2493407A CA 2493407 A1 CA2493407 A1 CA 2493407A1
Authority
CA
Canada
Prior art keywords
application
replication
resources
node
continuity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CA002493407A
Other languages
English (en)
Other versions
CA2493407C (fr
Inventor
Marc Vertes
Laurent Dufour
Francois Richard
Gregory Kurz
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of CA2493407A1 publication Critical patent/CA2493407A1/fr
Application granted granted Critical
Publication of CA2493407C publication Critical patent/CA2493407C/fr
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2097Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements maintaining the standby controller/processing unit updated
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2038Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with a single idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2041Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant with more than one idle spare processing component
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/202Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant
    • G06F11/2046Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where processing functionality is redundant where the redundant components share persistent storage

Abstract

Procédé pour répliquer une application logicielle dans une architecture mult i- ordinateurs (cluster), cette application logicielle étant préalablement exécutée sur un premier ordinateur du cluster constituant un n.oelig.ud primaire ou opérationnel et étant destinée à être répliquée sur au moins un autre ordinateur du cluster constituant un n.oelig.ud secondaire, comprenant une réplication des ressources associées à cette application logicielle. Ce procédé comprend une mise à jour au fil de l'eau des ressources répliquées p ar un mécanisme d'introspection dynamique prévu pour fournir la structure de l'application à répliquer, ainsi que le graphe dynamique des ressources et dépendances mises en .oelig.uvre.

Claims (19)

1. Procédé pour répliquer une application logicielle dans une architecture multi-ordinateurs (cluster), ladite application logicielle étant préalablement exécutée sur un premier ordinateur dudit cluster constituant un noeud primaire et étant destinée à être répliquée sur au moins un autre ordinateur dudit cluster constituant un noeud secondaire, comprenant une réplication des ressources associées à ladite application logicielle, caractérisé en ce que les ressources répliquées incluent :
- la mémoire virtuelle de chaque processus concerné ainsi que sa pile d'appel, - des ressources systèmes (inter process communication, connexion réseau, etc.), et - des données écrites sur disques;
et en ce qu'il comprend en outre une mise à jour au fil de l'eau desdites ressources répliquées par un mécanisme d'introspection dynamique prévu pour fournir la structure de l'application à répliquer, et un graphe dynamique des ressources et dépendances mises en oeuvre.
2. Procédé de réplication selon la revendication 1, caractérisé en ce qu'il comprend en outre une création et une maintenance d'un arbre de dépendance, qui fournit à
chaque instant des informations sur les ressources qu'il est nécessaire de répliquer.
3. Procédé de réplication selon l'une des revendications 1 ou 2, caractérisé en ce qu'il comprend en outre un mécanisme de génération de point de reprise (« checkpointing »), par lequel les ressources à répliquer ont répliquées sur un ou plusieurs noeuds secondaires.
4. Procédé de réplication selon la revendication 3, caractérisé en ce qu'il comprend trois étapes :
- capture des ressources sur 1e noeud primaire, - transfert par le réseau vers un ou plusieurs noeuds secondaires, et - restauration sur le ou les noeuds secondaires.
5. Procédé de réplication selon l'une quelconque des revendications précédentes et la revendication 3, caractérisé en ce qu'il comprend en outre un mécanisme d'optimisation du mécanisme de génération de point de reprise.
6. Procédé de réplication selon la revendication 5, caractérisé en ce que le mécanisme de « checkpointing » est incrémental.
7. Procédé de réplication selon l'une des revendications 5 ou 6, caractérisé en ce que le mécanisme de « checkpointing » est discriminant.
8. Procédé de réplication selon l'une des revendications 5 à
7, caractérisé en ce que le mécanisme de « checkpointing »
inclut au moins l'une des fonctions suivantes :
- une barrière de synchronisation de processus (PSB), - une gestion de ressources (RM), - une gestion de ressources système (SRM),et - une gestion de ressources de processus (PRM).
9. Procédé de réplication selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il comprend en outre un mécanisme de réplication de fichiers de données applicatives entre un noeud opérationnel (OP) sur lequel l'application est exécutée et un noeud dit de stand-by (SB).
10. Procédé pour réaliser une continuité de fonctionnement d'une application logicielle dans une architecture multi-ordinateurs (cluster), cette application étant exécutée à un instant donné sur l'un des ordinateurs du cluster, appelé
noeud primaire ou opérationnel, les autres ordinateurs dudit cluster étant appelés noeuds secondaires, ce procédé mettant en oeuvre le procédé de réplication selon l'une quelconque des revendications précédentes, caractérisé en ce qu'il comprend les étapes suivantes :
- réplication de l'application sur au moins des noeuds secondaires, de façon à réaliser au moins un clone de ladite application, - mise à jour au fil de l'eau dudit ou desdits clones, et - en cas de détection d'une défaillance ou d'un événement affectant ledit noeud opérationnel, basculement de service vers l'un au moins desdits clones.
11. Procédé de continuité de fonctionnement selon la revendication 10, caractérisé en ce que la réplication de l'application est de nature holistigue.
12. Procédé de continuité de fonctionnement selon l'une revendication 10 ou 11, caractérisé en ce qu'il comprend en outre une mise à jour des clones de l'application.
13. Procédé de continuité de fonctionnement selon l'une des revendications 10 à 12, caractérisé en ce qu'il comprend en-outre une supervision de l'état de ressources nécessairement au fonctionnement de l'application.
14. Procédé de continuité de fonctionnement selon l'une des revendications 10 à 13, caractérisé en ce qu'il comprend en outre, à la suite d'une détection d'une défaillance ou d'un événement affectant le noeud opérationnel, une étape pour élire, parmi des clones installés sur des noeuds secondaires, un clone pour être substitué à l'application initiale, le noeud sur lequel ledit clone élu est installé devenant le nouveau noeud opérationnel.
15. Procédé de continuité de fonctionnement selon l'une des revendications 10 à 14, caractérisé en ce qu'il comprend en outre un enregistrement sur chaque clone de messages reçus par le noeud primaire ou opérationnel, ces messages étant réinjectés dans le clone élu nouvel opérationnel en cas de basculement.
16. Système multi-ordinateurs prévu pour exécuter sur au moins desdits ordinateurs au moins une application logicielle, implémentant 1e procédé pour réaliser une continuité de fonctionnement selon l'une quelconque des revendications 11 à 15.
17. Application du procédé de réplication selon l'une quelconque des revendications 1 à 9, pour une optimisation automatique de ressources informatiques par partage de charge par répartition dynamique de processus.
18. Application du procédé de réplication selon l'une quelconque des revendications 1 à 9, pour une maintenance non interruptive par relocation à la demande de processus au travers d'un réseau de ressources informatiques.
19. Application du procédé de réplication selon l'une quelconque des revendications 1 à 9, pour une préservation de contexte applicatif dans des applications mobiles.
CA2493407A 2002-08-02 2003-07-28 Procede de replication d'une application logicielle dans une architecture multi-ordinateurs, procede pour realiser une continuite de fonctionnement mettant en oeuvre ce procede de replication, et systeme multi-ordinateurs ainsi equipe Expired - Lifetime CA2493407C (fr)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0209855A FR2843209B1 (fr) 2002-08-02 2002-08-02 Procede de replication d'une application logicielle dans une architecture multi-ordinateurs, procede pour realiser une continuite de fonctionnement mettant en oeuvre ce procede de replication, et systeme multi-ordinateurs ainsi equipe.
FR02/09855 2002-08-02
PCT/FR2003/002371 WO2004015574A2 (fr) 2002-08-02 2003-07-28 Continuite de fonctionnement par replication d’un locigiel dans une architecture multi-ordinateurs

Publications (2)

Publication Number Publication Date
CA2493407A1 true CA2493407A1 (fr) 2004-02-19
CA2493407C CA2493407C (fr) 2010-05-11

Family

ID=30129640

Family Applications (1)

Application Number Title Priority Date Filing Date
CA2493407A Expired - Lifetime CA2493407C (fr) 2002-08-02 2003-07-28 Procede de replication d'une application logicielle dans une architecture multi-ordinateurs, procede pour realiser une continuite de fonctionnement mettant en oeuvre ce procede de replication, et systeme multi-ordinateurs ainsi equipe

Country Status (9)

Country Link
US (1) US7725763B2 (fr)
EP (1) EP1529259B1 (fr)
JP (1) JP2005535044A (fr)
AT (1) ATE434790T1 (fr)
AU (1) AU2003273481A1 (fr)
CA (1) CA2493407C (fr)
DE (1) DE60328100D1 (fr)
FR (1) FR2843209B1 (fr)
WO (1) WO2004015574A2 (fr)

Families Citing this family (70)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9213609B2 (en) * 2003-12-16 2015-12-15 Hewlett-Packard Development Company, L.P. Persistent memory device for backup process checkpoint states
US20050216552A1 (en) * 2004-03-24 2005-09-29 Samuel Fineberg Communication-link-attached persistent memory system
US7475296B2 (en) * 2004-05-20 2009-01-06 International Business Machines Corporation Serviceability and test infrastructure for distributed systems
FR2872605B1 (fr) * 2004-06-30 2006-10-06 Meiosys Sa Procede de gestion d'un processus logiciel, procede et systeme de redistribution ou de continuite de fonctionnement dans une architecture multi-ordinateurs
US7293200B2 (en) * 2004-08-26 2007-11-06 Availigent, Inc. Method and system for providing transparent incremental and multiprocess checkpointing to computer applications
US8122280B2 (en) 2004-08-26 2012-02-21 Open Invention Network, Llc Method and system for providing high availability to computer applications
FR2881244B1 (fr) * 2005-01-24 2007-05-04 Meiosys Soc Par Actions Simpli Procede de comptage d'instructions pour journalisation et rejeu d'une sequence d'evenements deterministes
US7774647B2 (en) * 2005-01-28 2010-08-10 International Business Machines Corporation Method for counting instructions for logging and replay of a deterministic sequence of events
FR2882165B1 (fr) * 2005-02-11 2007-06-29 Airbus France Sas Systeme et procede de traitements embarques d'essais en vol
FR2883083B1 (fr) * 2005-03-14 2007-05-04 Meiosys Soc Par Actions Simpli Procede d'execution d'une application dans un conteneur virtuel formant une session d'environnement virtualise
US7937616B2 (en) * 2005-06-28 2011-05-03 International Business Machines Corporation Cluster availability management
US8301700B1 (en) 2010-08-06 2012-10-30 Open Invention Network Llc System and method for event-driven live migration of multi-process applications
US8621275B1 (en) 2010-08-06 2013-12-31 Open Invention Network, Llc System and method for event-driven live migration of multi-process applications
US9141481B1 (en) * 2010-08-06 2015-09-22 Open Invention Network, Llc System and method for reliable non-blocking messaging for multi-process application replication
US9043640B1 (en) 2005-08-26 2015-05-26 Open Invention Network, LLP System and method for event-driven live migration of multi-process applications
US8078910B1 (en) 2008-12-15 2011-12-13 Open Invention Network, Llc Method and system for providing coordinated checkpointing to a group of independent computer applications
US7681075B2 (en) * 2006-05-02 2010-03-16 Open Invention Network Llc Method and system for providing high availability to distributed computer applications
US8752049B1 (en) 2008-12-15 2014-06-10 Open Invention Network, Llc Method and computer readable medium for providing checkpointing to windows application groups
US8584145B1 (en) 2010-08-06 2013-11-12 Open Invention Network, Llc System and method for dynamic transparent consistent application-replication of multi-process multi-threaded applications
US8281184B1 (en) 2010-08-06 2012-10-02 Open Invention Network Llc System and method for reliable non-blocking messaging for multi-process application replication
US8195722B1 (en) 2008-12-15 2012-06-05 Open Invention Network, Llc Method and system for providing storage checkpointing to a group of independent computer applications
US8589953B1 (en) * 2010-08-06 2013-11-19 Open Invention Network, Llc System and method for transparent consistent application-replication of multi-process multi-threaded applications
US8082468B1 (en) 2008-12-15 2011-12-20 Open Invention Networks, Llc Method and system for providing coordinated checkpointing to a group of independent computer applications
US20070174484A1 (en) * 2006-01-23 2007-07-26 Stratus Technologies Bermuda Ltd. Apparatus and method for high performance checkpointing and rollback of network operations
US20070234342A1 (en) * 2006-01-25 2007-10-04 Flynn John T Jr System and method for relocating running applications to topologically remotely located computing systems
US7904886B2 (en) * 2006-03-13 2011-03-08 International Business Machines Corporation Method for executing an application in a virtual container forming a virtualized environment session
US7613749B2 (en) 2006-04-12 2009-11-03 International Business Machines Corporation System and method for application fault tolerance and recovery using topologically remotely located computing devices
GB0611038D0 (en) * 2006-06-02 2006-07-12 Ibm Apparatus and method for cluster recovery
US8117604B2 (en) * 2006-07-31 2012-02-14 International Business Machines Corporation Architecture cloning for power PC processors
US7594138B2 (en) 2007-01-31 2009-09-22 International Business Machines Corporation System and method of error recovery for backup applications
US9384159B2 (en) 2007-05-24 2016-07-05 International Business Machines Corporation Creating a checkpoint for a software partition in an asynchronous input/output environment
US9473598B2 (en) * 2007-12-18 2016-10-18 International Business Machines Corporation Network connection failover during application service interruption
US7996094B2 (en) * 2008-09-09 2011-08-09 Rockwell Automation Technologies, Inc. Usage of a virtual unit
US10019327B1 (en) 2008-12-15 2018-07-10 Open Invention Network Llc System and method for hybrid kernel- and user-space incremental and full checkpointing
US8281317B1 (en) 2008-12-15 2012-10-02 Open Invention Network Llc Method and computer readable medium for providing checkpointing to windows application groups
US9354977B1 (en) * 2008-12-15 2016-05-31 Open Invention Network Llc System and method for hybrid kernel- and user-space incremental and full checkpointing
US9256496B1 (en) * 2008-12-15 2016-02-09 Open Invention Network, Llc System and method for hybrid kernel—and user-space incremental and full checkpointing
US8752048B1 (en) 2008-12-15 2014-06-10 Open Invention Network, Llc Method and system for providing checkpointing to windows application groups
US8341631B2 (en) 2009-04-10 2012-12-25 Open Invention Network Llc System and method for application isolation
US8826070B1 (en) 2008-12-15 2014-09-02 Open Invention Network, Llc Method and system for providing storage checkpointing to a group of independent computer applications
US8880473B1 (en) * 2008-12-15 2014-11-04 Open Invention Network, Llc Method and system for providing storage checkpointing to a group of independent computer applications
US8745442B1 (en) * 2011-04-28 2014-06-03 Open Invention Network, Llc System and method for hybrid kernel- and user-space checkpointing
US11538078B1 (en) 2009-04-10 2022-12-27 International Business Machines Corporation System and method for usage billing of hosted applications
US9058599B1 (en) 2009-04-10 2015-06-16 Open Invention Network, Llc System and method for usage billing of hosted applications
US9003360B1 (en) * 2009-12-10 2015-04-07 The Mathworks, Inc. Configuring attributes using configuration subgraphs
US9195500B1 (en) 2010-02-09 2015-11-24 F5 Networks, Inc. Methods for seamless storage importing and devices thereof
US9135127B1 (en) 2010-08-06 2015-09-15 Open Invention Network, Llc System and method for dynamic transparent consistent application-replication of multi-process multi-threaded applications
US9286298B1 (en) * 2010-10-14 2016-03-15 F5 Networks, Inc. Methods for enhancing management of backup data sets and devices thereof
US11625307B1 (en) 2011-04-28 2023-04-11 International Business Machines Corporation System and method for hybrid kernel- and user-space incremental and full checkpointing
US11307941B1 (en) 2011-04-28 2022-04-19 Open Invention Network Llc System and method for hybrid kernel- and user-space incremental and full checkpointing
KR101249719B1 (ko) * 2011-05-04 2013-04-03 주식회사 인프라웨어테크놀러지 어플리케이션 클론 실행 방법, 컴퓨터로 판독가능한 기록매체, 및 이를 지원하는 클론단말
US8984336B1 (en) * 2012-02-20 2015-03-17 Symantec Corporation Systems and methods for performing first failure data captures
US9020912B1 (en) 2012-02-20 2015-04-28 F5 Networks, Inc. Methods for accessing data in a compressed file system and devices thereof
US9104645B2 (en) 2012-07-27 2015-08-11 Dell Products, Lp System and method of replicating virtual machines for live migration between data centers
US8935568B2 (en) 2012-07-27 2015-01-13 Dell Products, Lp System and method of replicating virtual machines for live migration between data centers
US9201649B2 (en) * 2012-10-26 2015-12-01 Inforsys Limited Systems and methods for estimating an impact of changing a source file in a software
US9251002B2 (en) 2013-01-15 2016-02-02 Stratus Technologies Bermuda Ltd. System and method for writing checkpointing data
US9298790B2 (en) * 2013-01-18 2016-03-29 Microsoft Technology Licensing, Llc Replication of assets across data centers
US10719562B2 (en) 2013-12-13 2020-07-21 BloomReach Inc. Distributed and fast data storage layer for large scale web data services
ES2652262T3 (es) 2013-12-30 2018-02-01 Stratus Technologies Bermuda Ltd. Método de retardar puntos de comprobación inspeccionando paquetes de red
EP3090344B1 (fr) 2013-12-30 2018-07-18 Stratus Technologies Bermuda Ltd. Systèmes et procédés de points de contrôle dynamiques
US9588844B2 (en) 2013-12-30 2017-03-07 Stratus Technologies Bermuda Ltd. Checkpointing systems and methods using data forwarding
US10834065B1 (en) 2015-03-31 2020-11-10 F5 Networks, Inc. Methods for SSL protected NTLM re-authentication and devices thereof
US10228962B2 (en) 2015-12-09 2019-03-12 Commvault Systems, Inc. Live synchronization and management of virtual machines across computing and virtualization platforms and using live synchronization to support disaster recovery
US10387266B2 (en) 2015-12-23 2019-08-20 Commvault Systems, Inc. Application-level live synchronization across computing platforms including synchronizing co-resident applications to disparate standby destinations and selectively synchronizing some applications and not others
US10404698B1 (en) 2016-01-15 2019-09-03 F5 Networks, Inc. Methods for adaptive organization of web application access points in webtops and devices thereof
US11308109B2 (en) * 2018-10-12 2022-04-19 International Business Machines Corporation Transfer between different combinations of source and destination nodes
US11188386B2 (en) * 2019-11-01 2021-11-30 Sap Portals Israel Ltd. Lightweight remote process execution
US11327663B2 (en) 2020-06-09 2022-05-10 Commvault Systems, Inc. Ensuring the integrity of data storage volumes used in block-level live synchronization operations in a data storage management system
US20220382478A1 (en) * 2021-06-01 2022-12-01 Samsung Electronics Co., Ltd. Systems, methods, and apparatus for page migration in memory systems

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5852724A (en) * 1996-06-18 1998-12-22 Veritas Software Corp. System and method for "N" primary servers to fail over to "1" secondary server
WO1997049039A1 (fr) * 1996-06-21 1997-12-24 Bell Communications Research, Inc. Appareils et methodes destines a des services de repertoire aisement disponibles dans l'environnement de calcul decentralise
US6360331B2 (en) * 1998-04-17 2002-03-19 Microsoft Corporation Method and system for transparently failing over application configuration information in a server cluster
US6363416B1 (en) * 1998-08-28 2002-03-26 3Com Corporation System and method for automatic election of a representative node within a communications network with built-in redundancy
US6438705B1 (en) * 1999-01-29 2002-08-20 International Business Machines Corporation Method and apparatus for building and managing multi-clustered computer systems
US7028217B2 (en) * 2001-06-04 2006-04-11 Lucent Technologies Inc. System and method of general purpose data replication between mated processors
US7093013B1 (en) * 2002-06-19 2006-08-15 Alcatel High availability system for network elements
US7134044B2 (en) * 2002-08-16 2006-11-07 International Business Machines Corporation Method, system, and program for providing a mirror copy of data
US7058846B1 (en) * 2002-10-17 2006-06-06 Veritas Operating Corporation Cluster failover for storage management services
JP4315016B2 (ja) * 2004-02-24 2009-08-19 株式会社日立製作所 コンピュータシステムの系切替方法
US7743372B2 (en) * 2005-06-28 2010-06-22 Internatinal Business Machines Corporation Dynamic cluster code updating in logical partitions
US7761573B2 (en) * 2005-12-07 2010-07-20 Avaya Inc. Seamless live migration of virtual machines across optical networks

Also Published As

Publication number Publication date
CA2493407C (fr) 2010-05-11
WO2004015574B1 (fr) 2004-12-16
EP1529259A2 (fr) 2005-05-11
AU2003273481A8 (en) 2004-02-25
DE60328100D1 (de) 2009-08-06
WO2004015574A3 (fr) 2004-09-02
JP2005535044A (ja) 2005-11-17
FR2843209B1 (fr) 2006-01-06
ATE434790T1 (de) 2009-07-15
FR2843209A1 (fr) 2004-02-06
US20050251785A1 (en) 2005-11-10
US7725763B2 (en) 2010-05-25
EP1529259B1 (fr) 2009-06-24
AU2003273481A1 (en) 2004-02-25
WO2004015574A2 (fr) 2004-02-19

Similar Documents

Publication Publication Date Title
CA2493407A1 (fr) Procede de replication d'une application logicielle dans une architecture multi-ordinateurs, procede pour realiser une continuite de fonctionnement mettant en oeuvre ce procede de replication, et systeme multi-ordinateurs ainsi equipe
CN110737442B (zh) 一种边缘应用管理方法及系统
US10735509B2 (en) Systems and methods for synchronizing microservice data stores
CN1190733C (zh) 数据管理应用程序的故障恢复方法和系统
US6421739B1 (en) Fault-tolerant java virtual machine
US9785691B2 (en) Method and apparatus for sequencing transactions globally in a distributed database cluster
US20100162039A1 (en) High Availability and Disaster Recovery Using Virtualization
Buntinas et al. Blocking vs. non-blocking coordinated checkpointing for large-scale fault tolerant MPI protocols
TWI725744B (zh) 透過多層次相關性建立系統資源預測及資源管理模型的方法
WO2006010812A2 (fr) Procede de gestion d'un processus logiciel, procede et systeme de redistribution ou de continuite de fonctionnement dans une architecture multi-ordinateurs
JP2000112911A (ja) コンピュ―タネットワ―クにおけるデ―タベ―ス管理システムにおいて自動的にタスクを再分配するシステム及び方法
JP2000222373A (ja) マルチクラスタ化コンピュ―タ・システムを構成及び管理する方法及び装置
US7870248B2 (en) Exploiting service heartbeats to monitor file share
US20190266016A1 (en) Intelligent scheduling of backups
Izrailevsky et al. Cloud reliability
Su et al. Passive and partially active fault tolerance for massively parallel stream processing engines
Riabko et al. Cluster fault tolerance model with migration of virtual machines
Cardoso et al. Validation of a dynamic checkpoint mechanism for apache hadoop with failure scenarios
Thanakornworakij et al. High availability on cloud with HA-OSCAR
Posey et al. Infrastructure for transportation cyber-physical systems
Alimjon Problems of data replication in distribution systems
Richard et al. I-Cluster: Intense computing with untapped resources
CN114090339A (zh) 数据库流复制方法及装置
Siram Witness for Two-Site Enabled Coordination
Meroufel et al. Adaptive checkpointing with reliable storage in cloud environment

Legal Events

Date Code Title Description
EEER Examination request
MKEX Expiry

Effective date: 20230728

MKEX Expiry

Effective date: 20230728